محققان در مقاله جدیدی از ابزاری به نام HarnessX رونمایی کردهاند که به جای اتکای صرف به بزرگتر کردن مدلهای هوش مصنوعی (Scaling)، بر بهبود «محیط اجرا» یا همان داربستهای عملیاتی (Harness) تمرکز دارد.
✅ چرا این خبر مهم است؟
تا امروز، ابزارهایی که به مدلهای هوش مصنوعی برای استدلال و عمل کمک میکنند (مثل ابزارها، حافظه و پرامپتها) عمدتاً به صورت دستی طراحی میشدند. HarnessX با استفاده از یک موتور تکاملی هوشمند، این فرآیند را خودکار و بهینهسازی میکند.
نتایج آزمایشها روی بنچمارکهای معتبری مثل SWE-bench نشان میدهد که این روش میتواند عملکرد مدلها را تا ۴۴ درصد بهبود ببخشد؛ اتفاقی که ثابت میکند هوش مصنوعی با بهینهسازی رابطهای اجرایی میتواند بسیار قدرتمندتر ظاهر شود.
آیندهی ایجنتهای هوشمند با این نوع زیرساختهای پویا و منعطف، هیجانانگیزتر از همیشه به نظر میرسد! 🤖✨
منبع: arXiv AI



