یکی از چالشهای بزرگ در دنیای «هوش مصنوعی تجسمیافته» (Embodied AI)، هزینه بالای جمعآوری دادههای آموزشی توسط متخصصان است. حالا محققان با معرفی فریمورک نوآورانه TAP (مخفف Task-Agnostic Pretraining)، راهکار جالبی پیدا کردهاند!
این مدل جدید با جدا کردن دو مفهوم «چگونه حرکت کردن» از «چه کاری انجام دادن»، به رباتها اجازه میدهد ابتدا مهارتهای حرکتی پایه را از دادههای بدون برچسب (ارزان) یاد بگیرند و سپس با دادههای بسیار اندک، زبان و مفاهیم را درک کنند.
نتایج فوقالعاده است: این مدل با دادههای بسیار کمتر، عملکردی مشابه مدلهای آموزشدیده با ۱ میلیون داده تخصصی دارد و در محیطهای واقعی نیز نسبت به مدلهای فعلی بسیار مقاومتر عمل میکند. این یعنی آینده رباتیک در حال بهینهتر شدن است! 🦾✨
منبع: arXiv AI



