🧠 آیا مدل‌های زبانی واقعاً «استدلال» می‌کنند یا فقط حافظه‌ی قوی دارند؟

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در یک پژوهش جدید، بنچ‌مارک جذابی به نام IsoSci معرفی کرده‌اند که پرده از یک حقیقت مهم برمی‌دارد: بسیاری از مدل‌های هوش مصنوعی که فکر می‌کنیم در حال «استدلال» (Reasoning) هستند، در واقع فقط در حال بازیابی دانشِ حفظ شده از حافظه‌شان هستند!

نتایج این تحقیق نشان می‌دهد که بیش از ۹۱ درصد از پیشرفت‌های مدل‌ها در حل مسائل علمی، نه به خاطر قدرت استدلال، بلکه به دلیل تکیه بر اطلاعات ذخیره‌شده است. این یعنی حتی مدل‌های پیشرفته‌ای که در آزمون‌های دشوار موفق عمل می‌کنند، اگر با مسائل جدیدی با ساختار منطقی مشابه اما در حوزه‌های ناشناخته مواجه شوند، ممکن است عملکرد ضعیفی داشته باشند.

این یافته یک چالش جدی برای آینده توسعه هوش مصنوعی است و به ما یادآوری می‌کند که هنوز تا رسیدن به «استدلال واقعی» در مدل‌ها فاصله داریم. 🤖✨

منبع: arXiv AI