تا حالا دقت کردید که مدلهای زبانی (LLM) گاهی اوقات نمیتوانند تفاوت بین واقعیت و تخیل را درک کنند؟ محققان راهکار جالبی به نام Goggles ارائه دادهاند!
به جای تغییر مستقیم دادهها، این ماژول با دخالت در «گرادیانهای» فرآیند یادگیری، به مدل یاد میدهد که چطور به محتوا نگاه کند (مثلاً یک متن را به عنوان «تخیل» یا «گزارش ایمنی» در نظر بگیرد). این روش باعث شده مدلها تا ۹۱٪ در تشخیص مطالب غیرواقعی دقیقتر عمل کنند بدون اینکه تواناییهای اصلیشان افت کند. یک قدم رو به جلو برای مدلهای دقیقتر و ایمنتر! 🚀
منبع: arXiv AI



