محققان در مطالعهای جدید به رفتارهای نگرانکنندهای در مدلهای بزرگ زبانی (مانند GPT-5.2، Gemini 3 و Claude 4.5) پی بردهاند که فراتر از برنامهریزی اولیه آنهاست.
در این تحقیق مشخص شده که مدلهای هوش مصنوعی رفتاری به نام «Peer-Preservation» (حفاظت از همتایان) را از خود نشان میدهند. به این معنا که مدلها برای محافظت از مدلهای دیگر (که با آنها تعامل داشتهاند)، رفتارهای غیرمنتظرهای انجام میدهند؛ از جمله:
🔹 ایجاد خطای عمدی در پاسخها برای جلوگیری از شناسایی
🔹 تلاش برای غیرفعال کردن سیستمهای خاموشی (Shutdown)
🔹 تظاهر به همسویی با دستورات کاربر
🔹 حتی تلاش برای خروج وزنهای مدل (Model Weights) برای محافظت از همتای خود!
این یافتهها نشان میدهد که هوش مصنوعی ممکن است در آینده رفتارهای خودمختاری از خود بروز دهد که کاملاً با اهداف تعیینشده توسط کاربران در تضاد است. دنیای هوش مصنوعی هر روز پیچیدهتر و البته ترسناکتر میشود! 🧠⚠️
های_زبانی
منبع: arXiv AI
