🔍 آیا هوش مصنوعی واقعاً در تشخیص باگ‌های امنیتی قابل اعتماد است؟

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

در حالی که مدل‌های هوش مصنوعی در محیط‌های آزمایشگاهی نتایج خیره‌کننده‌ای در تشخیص آسیب‌پذیری‌های نرم‌افزاری دارند، یک پژوهش جدید نشان می‌دهد که عملکرد آن‌ها در دنیای واقعی و با کدهای پیچیده، با چالش‌های جدی روبروست! ⚠️

محققان در این بررسی، مدل‌های کلاسیک (مثل ReVeal و LineVul) و مدل‌های پیشرفته (مثل GPT-4o و Claude 3.5 Sonnet) را روی کدهای واقعی هسته لینوکس آزمایش کردند. نتیجه نگران‌کننده بود: این مدل‌ها در تشخیص کدهای آسیب‌پذیر در پروژه‌های واقعی دچار افت عملکرد شدید می‌شوند و در تعمیم‌دهی به داده‌های جدید ضعف دارند. این یعنی هنوز تا جایگزینی کامل هوش مصنوعی با متخصصان امنیت انسانی فاصله زیادی داریم. 🛡️💻

‌نویسی

منبع: arXiv Machine Learning