محققان در یک پژوهش جدید، متد نوآورانهای به نام I-ASIDE معرفی کردهاند که به ما کمک میکند بفهمیم چرا مدلهای هوش مصنوعی در برابر تغییرات و حملات مخرب آسیبپذیر هستند.
این روش با استفاده از «نظریه شاپلی»، ویژگیهای قدرتمند و مقاوم یک مدل را از ویژگیهای ضعیف جدا میکند. جالب اینجاست که تحقیقات نشان میدهد مدلها در برابر فرکانسهای پایین (جزئیات کلی) مقاومترند، اما برای دقت بالا به اطلاعات فرکانس بالا (جزئیات دقیق) نیاز دارند که همین موضوع پاشنه آشیل آنهاست.
این ابزار جدید گام مهمی برای درک مکانیسمهای درونی مدلهای بینایی و افزایش امنیت آنهاست. 🛡️💻
منبع: arXiv AI



