یادگیری تقویتشده (RL) برای رباتها همیشه با یک چالش بزرگ روبرو بوده: هزینه بالای تمرین در دنیای واقعی! حالا محققان فریمورک جدیدی به نام WorldSample معرفی کردهاند که این مشکل را حل میکند.
این مدل با ترکیب دادههای واقعی و مدلهای شبیهساز (World Model)، یک چرخه هوشمند ایجاد میکند تا رباتها با تعداد دفعات کمتری شکست بخورند و سریعتر یاد بگیرند. نتایج خیرهکننده است: ۲۸٪ افزایش موفقیت در انجام وظایف و کاهش ۵۹ درصدی مراحل آموزشی! 🚀
این یعنی قدمی بلندتر به سمت رباتهایی که هوشمندتر و اقتصادیتر در دنیای واقعی کنار ما فعالیت میکنند.
منبع: arXiv AI



