محققان در مقاله جدیدی به بررسی مشکلی جالب به نام «Overthinking» یا زیادهروی در فکر کردن پرداختهاند. حتماً دیدید که مدلهای زبانی گاهی در زنجیره استدلال خود گیر میکنند و با خودگوییهای بیفایده و تناقضهای الکی، فقط توکن هدر میدهند.
تکنیک جدیدی به نام «DASH» معرفی شده که به مدل یاد میدهد کجا باید توقف کند! این روش با بررسی مسیرهای استدلال، بخشهایی که به پاسخ درست منجر میشوند را تقویت میکند. نتیجه؟ دقت بالاتر در مسائل ریاضی و منطقی پیچیده و البته جلوگیری از هدررفت منابع.
این پیشرفت یعنی مدلهای آینده نه تنها باهوشتر، بلکه بهصرفهتر و سریعتر خواهند بود. 🚀
منبع: arXiv NLP
