🧠 داوری منصفانه با هوش مصنوعی: پایانِ سوگیری‌های رایج!

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در مقاله‌ای جدید به سراغ حل یکی از مشکلات بزرگ مدل‌های زبانی (LLM) رفته‌اند: «سوگیری در داوری». تا امروز، استفاده از LLMها برای رتبه‌بندی خروجی‌ها (مثل انتخاب بهترین مدل یا مقاله) با مشکلاتی مثل «پرگویی» یا «تاثیر موقعیت» همراه بود که باعث می‌شد رتبه‌بندی‌ها به جای کیفیت، بر اساس ظاهر و ساختار ارائه باشند.

این تحقیق جدید با ترکیب «استنتاج بیزی» و شناسایی هوشمندِ سوگیری‌های هر مدل، روشی ارائه داده که با کمترین هزینه و پرسش، دقیق‌ترین رتبه‌بندی را انجام می‌دهد. در واقع این متد جدید یاد می‌گیرد که هر داور (مدل) چه سوگیری خاصی دارد و آن را در محاسبات خود لحاظ می‌کند تا نتایج نهایی به واقعیت نزدیک‌تر باشد. 🎯

منبع: arXiv Machine Learning