محققان در تازهترین مقاله خود، روش هوشمندانهای به نام SUNTA (Surprise-based Nested Temporal Abstraction) را معرفی کردهاند که یادگیری مدلهای ویدئویی را وارد سطح جدیدی کرده است.
در مدلهای فعلی، پیشبینی ویدئوهای طولانی معمولاً بعد از چند لحظه با خطا مواجه میشود؛ اما SUNTA با استفاده از «غافلگیری» (Surprise) بهعنوان معیاری برای تعیین مرزهای زمانی، اجازه میدهد مدل متوجه شود چه زمانی به زمینههای طولانیمدتتر نیاز دارد. نتیجه؟ پیشبینیهای دقیق تا ۲۵۰ گام زمانی که رقبای فعلی در ۱۰ گام شکست میخورند!
این نوآوری میتواند گام بزرگی برای ساخت دنیاهای مجازی و شبیهسازیهای واقعیتر توسط هوش مصنوعی باشد. 🎥🤖
منبع: arXiv AI



