یکی از نقاط ضعف مدلهای یادگیری تقویتی (Reinforcement Learning) این است که برای هر کار جدید باید از صفر آموزش ببینند. اما محققان در مقاله جدید با معرفی چارچوب MAGIK، این مشکل را حل کردهاند.
✨ نکته کلیدی: مدل MAGIK به ایجنتهای هوش مصنوعی اجازه میدهد با استفاده از «تخیل» (Imagination)، ساختار کارهای قبلی را به کارهای جدید مشابه نگاشت کنند. این یعنی ایجنت میتواند بدون نیاز به تمرین مجدد، دانش قبلی خود را در محیطهای جدید به کار ببرد (Zero-shot Transfer).
این دستاورد بزرگ گامی مهم برای هوش مصنوعی به سمت «استدلال تمثیلی» است که انسانها به صورت طبیعی در آن مهارت دارند.
منبع: arXiv AI



