🚀 بهبود استدلال هوش مصنوعی با یادگیری نیمه‌نظارتی! 🧠

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در مقاله جدیدی سراغ روشی نوآورانه به نام «Semi-CoT» رفتند تا توانایی استدلال (Chain-of-Thought) در مدل‌های زبانی را بدون نیاز به حجم عظیم داده‌های برچسب‌دار افزایش دهند.

در این روش، مدل با استفاده از سوالات بدون برچسب و انتخاب هوشمندانه مسیرهای منطقی با آنتروپی پایین، خودش را برای رسیدن به پاسخ‌های دقیق‌تر آموزش می‌دهد. این یعنی هوش مصنوعی حالا می‌تواند از داده‌های بدون استفاده، الگوهای استدلالی قابل اعتماد بسازد.

نتایج اولیه در بنچمارک‌های ریاضی مثل GSM8K امیدوارکننده است و راه را برای مدل‌های خودآموزتر و دقیق‌تر هموار می‌کند.

منبع: arXiv AI