یکی از چالشهای بزرگ هوش مصنوعی، پاک کردن اطلاعات حساس و شخصی (PII) از حافظه مدلهاست. محققان به تازگی بنچمارک جدیدی به نام LACUNA را معرفی کردهاند که برخلاف روشهای قبلی، به جای بررسی خروجی مدل، مستقیماً «وزنهای مدل» را بررسی میکند تا بفهمد آیا اطلاعات واقعاً حذف شدهاند یا فقط پنهان شدهاند!
نتایج این تحقیق نشان میدهد که بسیاری از روشهای فعلی چندان دقیق نیستند و مدلها هنوز مستعد حملات «بازیابی اطلاعات» هستند. LACUNA گام مهمی برای افزایش امنیت و حریم خصوصی در مدلهای زبانی بزرگ است.
منبع: arXiv AI



