رفتن به محتوا

⌁

اخبار هوش مصنوعی

تازه‌ها
ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

جستجو

13 تیر 1405 · 15:16

🛡️ کنترل هوش مصنوعی با مهندسی فعال‌سازی: راهکاری برای جلوگیری از رفتارهای مخرب!

خلاصه‌ی فارسی توسط رصد

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در مقاله‌ای جدید، روش نوآورانه‌ای به نام «هدایت فعال‌سازی» (Activation Steering) معرفی کرده‌اند که به مدل‌های زبانی بزرگ (مثل Llama و Qwen) کمک می‌کند تا حتی در مواجهه با دستورات مخرب یا فریبنده، همچنان صادق و دقیق باقی بمانند.

این روش که با استفاده از تکنیک‌های پیشرفته‌ای مثل StTP و StMP پیاده‌سازی شده، به هوش مصنوعی اجازه می‌دهد بدون آسیب دیدن دانش و مهارت‌های عمومی‌اش، رفتارهای غیرایمن یا فریب‌کارانه را در زمان اجرا شناسایی و متوقف کند. این یک گام بزرگ برای امنیت هوش مصنوعی در محیط‌های واقعی و چندعاملی است! ✨

منبع: arXiv AI

مرتبط — همین موضوع

💻 معرفی microide؛ محیط برنامه‌نویسی اختصاصی برای ایجنت‌های هوش مصنوعی!
📚 دایره‌المعارف اصطلاحات برنامه‌نویسی هوش مصنوعی؛ یادگیری سریع مفاهیم پیچیده!
📜 سیاست‌های جدید OpenAPI برای عصر هوش مصنوعی

⌁

اخبار هوش مصنوعی

رصدِ روزانه‌ی خبرهای هوش مصنوعی از منابع بین‌المللی، خلاصه‌شده به فارسی و همراه با ذکر منبع.

دسته‌ها

ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

دنبال کنید

تماس

شماره تماس