محققان ابزار جدیدی به نام «Gavel» معرفی کردهاند که برای ارزیابی دقیق مدلهای زبانی (LLM) در پردازش اسناد بسیار طولانی (بیش از ۱۰۰ هزار توکن) طراحی شده است.
🔹 این ابزار نشان میدهد که مدلهای هوش مصنوعی امروزی در مواجهه با پروندههای حقوقی طولانی، به جای «توهم زدن» (Hallucination)، بیشتر با مشکل «از دست دادن اطلاعات کلیدی» روبرو هستند.
🔹 بخش جذاب این پروژه، Gavel-Agent است که میتواند با مصرف ۳۶ تا ۷۷ درصد توکن کمتر، دقت بالایی در استخراج اطلاعات داشته باشد و حتی در حوزههای پزشکی هم بهخوبی عمل میکند.
این پیشرفت گام بزرگی برای کاربردیتر کردن هوش مصنوعی در محیطهای تخصصی مثل وکالت و پزشکی است که نیاز به خواندن دهها سند سنگین دارند.
منبع: arXiv NLP
