رفتن به محتوا

⌁

اخبار هوش مصنوعی

تازه‌ها
ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

جستجو

13 تیر 1405 · 19:48

🎥 تحول در درک روایت‌ها توسط هوش مصنوعی با بنچمارک NarrativeTrack

خلاصه‌ی فارسی توسط رصد

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در مطالعه‌ای جدید، ضعف مدل‌های زبانی-تصویری (MLLM) در درک صحیح وقایع ویدئویی را هدف قرار داده‌اند. با وجود پیشرفت‌های بزرگ، این مدل‌ها هنوز در «دنبال کردن موجودیت‌ها» (Entities) در طول زمان و تشخیص تغییرات آن‌ها دچار مشکل هستند.

بنچمارک جدیدی به نام NarrativeTrack معرفی شده که با استفاده از چارچوب «استدلال ترکیبی» (CRP)، توانایی مدل‌ها را در سه سطحِ وجود موجودیت، تغییرات و ابهام بررسی می‌کند. نتایج نشان می‌دهد که مدل‌های فعلی، علی‌رغم درک بصری خوب، در حفظ انسجام زمانی ضعیف عمل کرده و گاهی دچار توهم هویتی می‌شوند. این قدمی بزرگ برای ساخت هوش مصنوعی است که واقعاً فیلم‌ها را «می‌فهمد» و نه فقط آن‌ها را «می‌بیند». 🤖✨

منبع: arXiv Machine Learning

مرتبط — همین موضوع

💻 معرفی microide؛ محیط برنامه‌نویسی اختصاصی برای ایجنت‌های هوش مصنوعی!
📚 دایره‌المعارف اصطلاحات برنامه‌نویسی هوش مصنوعی؛ یادگیری سریع مفاهیم پیچیده!
📜 سیاست‌های جدید OpenAPI برای عصر هوش مصنوعی

⌁

اخبار هوش مصنوعی

رصدِ روزانه‌ی خبرهای هوش مصنوعی از منابع بین‌المللی، خلاصه‌شده به فارسی و همراه با ذکر منبع.

دسته‌ها

ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

دنبال کنید

تماس

شماره تماس