محققان در یک ارزیابی جدید، عملکرد سه غول هوش مصنوعی یعنی Claude، ChatGPT (نسخه ۵.۴) و Gemini را در تشخیص دقیق احساسات (مانند عشق، شرم، کنایه و غیره) بررسی کردند. نتایج جالبی به دست آمده است:
📊 مدل Gemini با دقت ۳۹.۹ درصد، در صدر این رقابت قرار گرفته است.
❌ با این حال، همه این مدلها هنوز در درک مفاهیم پیچیده انسانی مثل «عشق» یا «شرم» ضعفهای جدی دارند و در بسیاری از موارد دچار خطاهای مشابه میشوند.
این تحقیق نشان میدهد که با وجود پیشرفتهای بزرگ، هنوز راه زیادی تا درک واقعی احساسات انسانی توسط ماشینها باقی مانده است. به نظر شما هوش مصنوعی چقدر میتواند در تحلیل احساسات دقیق باشد؟
منبع: arXiv NLP
