آیا هوش مصنوعی واقعاً تفاوتهای ظریف زبانی و فرهنگی را درک میکند؟ 🌍 پژوهش جدیدی منتشر شده که عملکرد مدلهای پیشرو (Frontier LLMs) را در درک لهجههای مصری و عراقی به چالش کشیده است.
نکات کلیدی این مطالعه:
✅ استفاده از دادههای ارزیابیشده توسط متخصصان بومی (SME).
✅ بررسی توانایی مدلها در تفکیک مسائل فرهنگی از مفاهیم صرفاً زبانی.
✅ مقایسه دقت مدلها به عنوان «داور» در ارزیابی خروجی سایر مدلها.
نتایج نشان میدهد که مدلها در درک لهجه مصری عملکرد بهتری نسبت به لهجه عراقی دارند و هنوز در تحلیلهای فرهنگی عمیق، چالشهایی برای رسیدن به دقت انسانی وجود دارد. این تحقیق قدم مهمی برای بومیسازی دقیقتر هوش مصنوعی در مناطق مختلف جهان است. 💡
منبع: arXiv NLP
