محققان مدل جدیدی به نام «SpeechCombine» معرفی کردهاند که دنیای مدلهای زبانی گفتاری (SLMs) را دگرگون میکند. برخلاف روشهای فعلی که به حجم عظیمی از دادههای آموزشی نیاز دارند، این مدل بدون نیاز به «آموزش دستوری» (Instruction Tuning) کار میکند.
نکته جذاب اینجاست: محققان با ترکیب هوشمندانه وزنهای یک مدل زبانی متنیِ آموزشدیده با یک مدل گفتاری، توانستند بدون صرف هزینههای سنگین برای جمعآوری دادههای گفتاری، قدرت درک دستورات را به مدلهای گفتاری منتقل کنند. این یعنی راهی سادهتر و بهینهتر برای ساخت دستیارهای صوتی هوشمندتر که دانش مدلهای متنی بزرگ را به راحتی به ارث میبرند. 🎙️✨
منبع: arXiv NLP



