آیا تا به حال به این فکر کردهاید که چرا برخی مدلهای شناسایی پهپادها (UAV) در آزمایشها دقتهای خیرهکنندهای دارند اما در دنیای واقعی شکست میخورند؟ پژوهش جدیدی نشان میدهد که دلیل اصلی این اتفاق، یک خطای رایج به نام «نشت داده» (Data Leakage) در هنگام ارزیابی مدل است.
محققان کشف کردهاند که تقسیمبندی نادرست دادهها به بخشهای آموزشی و آزمایشی باعث میشود مدل عملاً بخشهایی از همان فایلهای ضبطشده را حفظ کند (Memorize) و به جای یادگیریِ واقعیِ سیگنالهای پهپاد، فقط دادههای تمرینی را حفظ کرده باشد! 🧠
این مطالعه تأکید میکند که برای داشتن مدلهای قابلاعتماد در حوزههای امنیتی، باید حتماً فرآیند ارزیابی را بر اساس «ضبطهای مجزا» انجام داد، نه صرفاً قطعات کوچکشده از یک فایل واحد.
منبع: arXiv Machine Learning
