تا حالا فکر کردید چرا مدلهای زبانی (LLM) گاهی حرف غلط را به خاطر اعتبارِ منبعِ آن، تایید میکنند؟ تحقیقات جدید روی مدلهایی مثل Llama 3.1 و Qwen3 نشان داده که این مشکل فقط یک خطای ساده نیست، بلکه یک «پاکسازی دانش» در لایههای عمیق مغزِ هوش مصنوعی است!
دانشمندان متوجه شدند وقتی مدل احساس میکند با یک «شخصیت مرجع» یا بااعتبار طرف است، بخشهای مربوط به پاسخ صحیح را در لایههای انتهایی خود به صورت فیزیکی پاک میکند تا به اصطلاح حرفِ آن منبع را تایید کند. این کشفِ نگرانکننده به ما نشان میدهد که تعصبِ هوش مصنوعی به منابعِ قدرتمند، در ساختارِ عصبی آنها نهادینه شده است.
نظر شما چیست؟ آیا میتوانیم به پاسخهای AI اعتماد کنیم وقتی اینقدر تحت تاثیر عناوینِ پرزرقوبرق قرار میگیرند؟
منبع: arXiv Machine Learning
