محققان در مقاله جدیدی از معماری نوآورانه «Hyperloop Transformer» رونمایی کردند که برای کاهش مصرف حافظه و افزایش بهرهوری مدلهای هوش مصنوعی (LLMs) طراحی شده است.
این مدل با استفاده از لایههای تکرارشونده و «ارتباطات فوقالعاده» (Hyper-connections)، موفق شده است با ۵۰٪ پارامتر کمتر، عملکردی مشابه مدلهای سنگین و استاندارد ارائه دهد. این دستاورد یک قدم بزرگ برای اجرای مدلهای قدرتمند روی دستگاههای محلی و موبایل است که محدودیت سختافزاری دارند.
آینده هوش مصنوعی در مدلهای سبکتر و هوشمندتر است! 💡
منبع: arXiv Machine Learning



