🚀 تحولی در پیش‌بینی کلمات: متد جدید NITP برای آموزش مدل‌های زبانی 🧠

خلاصه‌ی فارسی توسط رصد

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در مقاله‌ای جدید، روش نوآورانه‌ای به نام NITP (Next Implicit Token Prediction) را معرفی کرده‌اند که فراتر از پیش‌بینی کلمه بعدی در مدل‌های زبانی معمولی عمل می‌کند.

این روش با اضافه کردن نظارت پیوسته در فضای نمایش معنایی (Representation Space)، از انحراف مدل جلوگیری کرده و باعث می‌شود مدل‌ها ساختار دقیق‌تری یاد بگیرند. نتایج خیره‌کننده است: در مدل‌های ۹ میلیاردی، شاهد بهبود ۵.۷ درصدی در بنچمارک MMLU-Pro بدون افزایش هزینه در زمان استفاده (Inference) هستیم! 🔥

این یعنی هوش مصنوعی‌های آینده با همین منابع فعلی، بسیار دقیق‌تر و منطقی‌تر عمل خواهند کرد.

🔗 لینک پروژه: https://github.com/aHapBean/NITP

منبع: arXiv NLP