محققان در مقالهای جدید به سراغ چالشی جذاب رفتهاند: چگونه هوش مصنوعی میتواند «رفتار» یا «سیاست» بازیکنان در بازیهای دو نفره با اطلاعات ناقص (مثل پوکر) را یاد بگیرد؟
در این پژوهش، روشهایی برای ایجاد مجموعهداده از سیاستهای بازی و یادگیری بازنمایی (Embedding) آنها ارائه شده است. این یعنی مدلها حالا میتوانند درک بهتری از نحوه تصمیمگیری در محیطهای پیچیده و استراتژیک داشته باشند. 🃏🤖
این تحقیق که برای اولین بار به بررسی سیستماتیک تکنیکهای یادگیری خودنظارتی (Self-supervised) در این حوزه پرداخته، کدها و متدولوژی خود را برای محققان این حوزه متنباز (Open Source) کرده است.
منبع: arXiv Machine Learning



