در حالی که مدلهای هوش مصنوعی در محیطهای آزمایشگاهی نتایج خیرهکنندهای در تشخیص آسیبپذیریهای نرمافزاری دارند، یک پژوهش جدید نشان میدهد که عملکرد آنها در دنیای واقعی و با کدهای پیچیده، با چالشهای جدی روبروست! ⚠️
محققان در این بررسی، مدلهای کلاسیک (مثل ReVeal و LineVul) و مدلهای پیشرفته (مثل GPT-4o و Claude 3.5 Sonnet) را روی کدهای واقعی هسته لینوکس آزمایش کردند. نتیجه نگرانکننده بود: این مدلها در تشخیص کدهای آسیبپذیر در پروژههای واقعی دچار افت عملکرد شدید میشوند و در تعمیمدهی به دادههای جدید ضعف دارند. این یعنی هنوز تا جایگزینی کامل هوش مصنوعی با متخصصان امنیت انسانی فاصله زیادی داریم. 🛡️💻
نویسی
منبع: arXiv Machine Learning



