محققان در مقالهای جدید، روش نوآورانهای به نام QuasiMoTTo معرفی کردهاند که میتواند «کارایی استنتاج» (Inference Compute) در مدلهای زبانی را به شکل چشمگیری افزایش دهد.
مشکل اصلی در مدلهای فعلی این است که وقتی از مدل میخواهیم چندین پاسخ متفاوت تولید کند، این نمونهها اغلب تکراری و هدردهنده منابع محاسباتی هستند. روش QuasiMoTTo با استفاده از تکنیک «مونتکارلو شبهتصادفی» (QMC)، باعث میشود پاسخها به جای همپوشانی، فضای خروجی را بهطور یکنواخت و بهینهتر پوشش دهند. این یعنی با همان مقدار پردازش، پاسخهای دقیقتر و متنوعتری دریافت میکنیم.
این دستاورد میتواند تحولی در آموزش مدلهای یادگیری تقویتی و بهبود خروجی ایجنتهای هوش مصنوعی باشد. قدمی کوچک اما موثر برای هوشمندتر شدن مدلهای بزرگ! 🧠✨
منبع: arXiv Machine Learning
