محققان تکنیک جدیدی به نام QTALE معرفی کردهاند که مشکل بزرگ ترکیب «کاهش تعداد لایههای فعال» (Token-Adaptive) و «کوانتیزاسیون» در مدلهای زبانی بزرگ را حل میکند.
تا امروز، ترکیب این دو روش معمولاً باعث افت دقت مدل میشد، اما QTALE با یک استراتژی آموزشی متفاوت و مکانیزم تنظیم انعطافپذیر، اجازه میدهد مدلها بدون کاهش دقت، بسیار سبکتر و سریعتر اجرا شوند. این یعنی آیندهای با مدلهای هوش مصنوعی که هم حافظه کمتری مصرف میکنند و هم سرعت پردازش بالاتری دارند! ⚡
منبع: arXiv Machine Learning



