تا به حال به این فکر کردهاید که رباتها چگونه «قصد» و «هدف» ما را برای نگاه کردن به محیط درک میکنند؟ محققان در یک مقاله جدید، مدلی به نام LIME را معرفی کردهاند که به رباتها اجازه میدهد بر اساس دستورات متنی، دوربین خود را به شکلی هوشمندانه و هدفمند حرکت دهند.
این مدل با یادگیری از ویدیوهای اولشخص (Egocentric)، میتواند تشخیص دهد برای بررسی یک شیء یا دیدن پشت یک مانع، دوربین باید به چه زاویهای بچرخد. این دستاورد گام بزرگی برای افزایش درک بصری و تعامل بهتر رباتهای خودران با محیط اطراف است. 📸✨
منبع: arXiv Machine Learning



