محققان در مقاله جدیدی سراغ روشی نوآورانه به نام «Semi-CoT» رفتند تا توانایی استدلال (Chain-of-Thought) در مدلهای زبانی را بدون نیاز به حجم عظیم دادههای برچسبدار افزایش دهند.
در این روش، مدل با استفاده از سوالات بدون برچسب و انتخاب هوشمندانه مسیرهای منطقی با آنتروپی پایین، خودش را برای رسیدن به پاسخهای دقیقتر آموزش میدهد. این یعنی هوش مصنوعی حالا میتواند از دادههای بدون استفاده، الگوهای استدلالی قابل اعتماد بسازد.
نتایج اولیه در بنچمارکهای ریاضی مثل GSM8K امیدوارکننده است و راه را برای مدلهای خودآموزتر و دقیقتر هموار میکند.
منبع: arXiv AI



