محققان در مقاله جدیدی، رویکردی نوآورانه برای ارتقای عملکرد مدلهای بینایی-زبانی-عملگرا (VLA) معرفی کردهاند. این روش که «Guided Action Flow» نام دارد، بدون نیاز به آموزش مجدد مدلهای سنگین، از یک سیستم «منتقد» (Critic) برای هدایت فرآیند تصمیمگیری رباتها استفاده میکند.
در این روش، مدل با استفاده از بازخوردهای عملی و دادههای موفقیت یا شکست، مسیر حرکت ربات را در حین اجرا بهبود میبخشد. نتایج آزمایشها روی وظایف پیچیده حرکتی (LIBERO) نشان میدهد که این تکنیک میتواند دقت موفقیت رباتها را بهطور قابل توجهی افزایش دهد. این یک گام مهم دیگر به سمت رباتهای خودمختار باهوشتر و دقیقتر است. 🤖⚙️
منبع: arXiv AI



