رفتن به محتوا

⌁

اخبار هوش مصنوعی

تازه‌ها
ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

جستجو

13 تیر 1405 · 16:26

🛡 چالش امنیت در مدل‌های زبانی: معرفی بنچمارک OpenSafeIntent

خلاصه‌ی فارسی توسط رصد

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

آیا هوش مصنوعی واقعاً در برابر دستورات مخرب «امن» عمل می‌کند؟ محققان در پژوهش جدیدی، بنچمارک «OpenSafeIntent» را معرفی کرده‌اند تا متوجه شوند آیا مدل‌ها می‌توانند قصد کاربر (Intent) را به درستی تشخیص دهند یا خیر.

نتایج این تحقیق نشان می‌دهد که بسیاری از مدل‌های کنونی، در محیط‌های تست، امن به نظر می‌رسند اما با تغییرات جزئی در لحن یا ساختار جملات (پارافریز)، در برابر درخواست‌های خطرناک یا دوگانه آسیب‌پذیر می‌شوند. این بنچمارک جدید راهی است برای ارزیابی دقیق‌تر و هوشمندانه‌ترِ امنیت مدل‌های هوش مصنوعی تا فراتر از ظاهرِ «امن بودن» حرکت کنیم.

منبع: arXiv AI

مرتبط — همین موضوع

💻 معرفی microide؛ محیط برنامه‌نویسی اختصاصی برای ایجنت‌های هوش مصنوعی!
📚 دایره‌المعارف اصطلاحات برنامه‌نویسی هوش مصنوعی؛ یادگیری سریع مفاهیم پیچیده!
📜 سیاست‌های جدید OpenAPI برای عصر هوش مصنوعی

⌁

اخبار هوش مصنوعی

رصدِ روزانه‌ی خبرهای هوش مصنوعی از منابع بین‌المللی، خلاصه‌شده به فارسی و همراه با ذکر منبع.

دسته‌ها

ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

دنبال کنید

تماس

شماره تماس