تا حالا دقت کردید که مدلهای زبانی (LLM) گاهی اوقات وقتی سوال ما مبهم یا ناقص است، باز هم سعی میکنند به هر قیمتی پاسخ بدهند و به بیراهه میروند؟ 🤔
محققان به تازگی بنچمارک جدیدی به نام «DiscoBench» معرفی کردهاند که هدفش هوشمندتر کردن ایجنتهای جستجوگر است. ایده اصلی این است که ایجنت یاد بگیرد به جای حدس و گمانهای اشتباه، در مواقع ابهام از کاربر سوالات شفافکننده بپرسد.
این تحقیق نشان میدهد که پرسیدنِ بهموقع، در دنیای «جستجوی عمیق» (Deep Search) بسیار کارآمدتر از حدس زدن کورکورانه است. گام بزرگی برای اینکه ایجنتهای هوشمند در آینده، دقیقتر و قابلاعتمادتر از قبل شوند! 🚀
منبع: arXiv NLP
