⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

⚖️ چالش مدل‌های زبانی در درک متون حقوقی طولانی

محققان ابزار جدیدی به نام «Gavel» معرفی کرده‌اند که برای ارزیابی دقیق مدل‌های زبانی (LLM) در پردازش اسناد بسیار طولانی (بیش از ۱۰۰ هزار توکن) طراحی شده است.

🔹 این ابزار نشان می‌دهد که مدل‌های هوش مصنوعی امروزی در مواجهه با پرونده‌های حقوقی طولانی، به جای «توهم زدن» (Hallucination)، بیشتر با مشکل «از دست دادن اطلاعات کلیدی» روبرو هستند.

🔹 بخش جذاب این پروژه، Gavel-Agent است که می‌تواند با مصرف ۳۶ تا ۷۷ درصد توکن کمتر، دقت بالایی در استخراج اطلاعات داشته باشد و حتی در حوزه‌های پزشکی هم به‌خوبی عمل می‌کند.

این پیشرفت گام بزرگی برای کاربردی‌تر کردن هوش مصنوعی در محیط‌های تخصصی مثل وکالت و پزشکی است که نیاز به خواندن ده‌ها سند سنگین دارند.

منبع: arXiv NLP

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *