محققان در پژوهشی جالب، مدلهای پیشرفته «رمزگشایی مغزی» (Brain-encoding) مانند TRIBE را روی ۴۸ ویدیو یوتیوب تست کردند تا ببینند آیا سیگنالهای عصبی پیشبینی شده توسط هوش مصنوعی، میتواند پیشبینی کند که کاربران کدام لحظات ویدیو را دوباره تماشا میکنند (Replay heatmap)؟
نتیجه؟ این مدلها با وجود دقت بالا در درک محتوای بصری، هیچ قدرت پیشبینی خاصی برای رفتار واقعی کاربران در یوتیوب نداشتند و عملکردشان فراتر از فاکتورهای سادهای مثل «صدا» یا «حرکت» نبود! این یعنی هنوز شکاف بزرگی بین درک مغزی ماشین و سلیقه واقعی انسان در تماشای ویدیو وجود دارد. 🎬🧐
منبع: arXiv Machine Learning



