محققان در پروژه جدیدی به سراغ مدل Qwen3.5-27B رفتند تا یک چالش بزرگ را حل کنند: اینکه مدلهای هوش مصنوعی فقط پاسخ نهایی را به زبان دیگری ندهند، بلکه «فکر کردن» و استدلالشان هم به زبان مقصد (در اینجا ترکی) باشد! 🇹🇷
در پروژه TUDUM، مدل یاد گرفته است که به جای ترجمه ذهنی از انگلیسی به ترکی، مراحل استدلال خود را مستقیماً به زبان ترکی بنویسد. اگرچه این مدل هنوز در برخی بنچمارکهای ریاضی رقیب سرسختی برای نسخههای پایه نیست، اما گامی مهم در جهت بومیسازی فرآیند تفکر مدلهای زبانی بزرگ است. این تحقیق نشان میدهد که چگونه میتوان با ترکیب آموزش نظارتشده (SFT) و یادگیری تقویتی (RL)، رفتار مدلها را در زبانهای غیرانگلیسی بهبود بخشید.
منبع: arXiv AI



