رفتن به محتوا

⌁

اخبار هوش مصنوعی

تازه‌ها
ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

جستجو

13 تیر 1405 · 18:27

🚀 بهبود استدلال در متن‌های طولانی؛ معرفی فریم‌ورک Maven 🧠

خلاصه‌ی فارسی توسط رصد

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

یکی از چالش‌های بزرگ مدل‌های زبانی (LLM)، مدیریت و استدلال صحیح روی متن‌های بسیار طولانی است. معمولاً مدل‌ها در پیدا کردن شواهد پراکنده در حجم عظیمی از داده‌ها دچار مشکل می‌شوند.

محققان به‌تازگی فریم‌ورک جدیدی به نام Maven معرفی کرده‌اند که با استفاده از «حافظه شواهد قابل ویرایش» و یادگیری تقویتی (RL)، به مدل یاد می‌دهد چطور به جای نگاه یک‌باره، مانند یک انسان شواهد را مرحله‌به‌مرحله جمع‌آوری، لینک یا حذف کند. نتایج آزمایش‌ها روی مدل‌های Llama و Qwen نشان می‌دهد که این روش، دقت استدلال را در بنچمارک‌های طولانی‌مدت به‌طور چشمگیری افزایش می‌دهد.

این یک قدم رو به جلو برای هوش مصنوعی‌هایی است که قرار است کتاب‌ها یا مستندات فنی طولانی را تحلیل کنند! 📚

منبع: arXiv AI

مرتبط — همین موضوع

💻 معرفی microide؛ محیط برنامه‌نویسی اختصاصی برای ایجنت‌های هوش مصنوعی!
📚 دایره‌المعارف اصطلاحات برنامه‌نویسی هوش مصنوعی؛ یادگیری سریع مفاهیم پیچیده!
📜 سیاست‌های جدید OpenAPI برای عصر هوش مصنوعی

⌁

اخبار هوش مصنوعی

رصدِ روزانه‌ی خبرهای هوش مصنوعی از منابع بین‌المللی، خلاصه‌شده به فارسی و همراه با ذکر منبع.

دسته‌ها

ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

دنبال کنید

تماس

شماره تماس