محققان در مقاله جدید خود به یک چالش مهم در دنیای بینایی ماشین پرداختهاند: چرا مدلهای هوش مصنوعی هنگام تشخیص «افعال» (مانند باز کردن) بیش از حد به «اشیاء» (مانند کشو) تکیه میکنند؟
این تحقیق نشان میدهد که مدلهای فعلی بهجای تحلیل حرکات زمانی، فقط بر اساس همنشینیهای تکراری در دادهها پیشبینی میکنند. برای حل این مشکل، متد جدیدی به نام RCORE پیشنهاد شده که با تمرکز بر نظم زمانی و کاهش سوگیریهای آماری، دقت مدلها را در تشخیص سناریوهای جدید و دیده نشده بهطور چشمگیری بهبود میبخشد. قدمی دیگر برای هوشمندتر شدن سیستمهای درک ویدیو! 🧠📹
منبع: arXiv AI



