یک تحقیق جدید و جذاب روی مدلهای زبانی محبوب مثل Llama 3.1، Qwen و Mistral نشان میدهد که برخلاف تصور، این مدلها در برابر زیر سوال بردن حقایق علمی (مثل تغییرات اقلیمی یا واکسیناسیون) بهراحتی تغییر موضع نمیدهند.
نتایج جالب این پژوهش نشان داد که مدلها بهجای عقبنشینی، استراتژیهای متفاوتی دارند:
🔹 برخی از آنها با قاطعیت بیشتری از حقیقت علمی دفاع میکنند (Reactive Assertion).
🔹 برخی لحن خود را ملایمتر میکنند اما همچنان پایدار میمانند (Surface Hedging).
🔹 برخی دیگر ترجیح میدهند پاسخ ندهند.
این بررسی به ما کمک میکند تا بهتر بفهمیم مدلهای هوش مصنوعی چطور با اطلاعات غلط و شکافکنیهای کاربران مقابله میکنند. دنیای امنیت و دقت در هوش مصنوعی هر روز پیچیدهتر و جذابتر میشود! 🤖✨
منبع: arXiv AI



