در دنیای پردازش زبان طبیعی (NLP)، اغلب از امتیازهای ستارهای کاربران به عنوان «برچسب حقیقت» برای آموزش مدلهای تحلیل احساسات استفاده میشود. اما یک پژوهش جدید نشان داده که این کار میتواند گمراهکننده باشد! 🧐
این مطالعه با بررسی بیش از ۱۶ هزار نقد و بررسی نشان داد که در ۱۸.۶٪ موارد، متن نوشته شده توسط کاربر با امتیازی که ثبت کرده همخوانی ندارد. به این پدیده «عدم تطابق احساسات» (Sentiment-Rating Incongruence) گفته میشود.
💡 چرا این خبر مهم است؟
اگر شما در حال ساخت مدلهای هوش مصنوعی هستید، این پژوهش هشدار میدهد که صرفاً تکیه بر امتیازهای ستارهای برای آموزش مدلها کافی نیست و ممکن است دادههای «نویزدار» یا نادرستی را به مدل تزریق کنید. کیفیت دادههای ورودی، کلید اصلی دقتِ خروجیهای هوشمند است. 🔍
منبع: arXiv NLP
