🏗️ معرفی BuilderBench: گامی تازه برای آموزش ایجنت‌های هوشمند!

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان ابزار جدیدی به نام «BuilderBench» را معرفی کرده‌اند که هدفش فراتر رفتن از یادگیری متنی مدل‌های هوش مصنوعی است. این بنچمارک با استفاده از یک شبیه‌ساز رباتیک و مجموعه‌ای از چالش‌های فیزیکی، به ایجنت‌ها کمک می‌کند تا به جای تقلید، از طریق «تجربه و اکتشاف» یاد بگیرند.

نکته جالب اینجاست که حتی پیشرفته‌ترین مدل‌های زبانی فعلی هم در حل چالش‌های پیچیده این محیط دچار مشکل هستند؛ موضوعی که نشان می‌دهد ما هنوز تا رسیدن به ایجنت‌هایی که در دنیای واقعی با «استدلال فیزیکی» عمل کنند، فاصله داریم. این تحقیق راه را برای آموزش ایجنت‌های خودمختار در آینده هموار می‌کند.

منبع: arXiv AI