دانشمندان اخیراً در یک پژوهش جدید، عملکرد مدلهای بینایی-زبانی (VLM) را در ارزیابی کیفیت تصاویر پزشکی (MIQA) زیر ذرهبین بردهاند. نتیجه جالب و البته نگرانکننده این تحقیق نشان میدهد که این مدلها بهشدت تحت تأثیر نویزهای تصویری و حتی «سوگیریهای متنی» قرار میگیرند!
💡 نکات کلیدی این گزارش:
✅ افت عملکرد شدید در مواجهه با تصاویر پیکسلی (تا ۳۴٪ افت دقت).
✅ تأثیر عجیب سوگیریها: مثلاً ذکر نام یک مؤسسه معتبر در متن، امتیاز کیفیت تصویر را تا ۱۷٪ به صورت کاذب بالا میبرد!
✅ تفاوت عملکرد فاحش بین مدلهای مختلف در تشخیص تصاویر دستکاریشده.
این نتایج نشان میدهد که قبل از اعتماد کامل به هوش مصنوعی در محیطهای درمانی، باید راهکارهای دقیقتری برای اطمینان از خروجیهای آن تدوین کرد تا امنیت بیماران به خطر نیفتد. آینده هوش مصنوعی در پزشکی همچنان به تحقیقات دقیقتری نیاز دارد. نظر شما چیست؟ آیا هوش مصنوعی میتواند جایگزین متخصص رادیولوژی شود؟
منبع: arXiv AI



