یکی از چالشهای بزرگ در یادگیری ماشین، هزینهبر بودن برچسبگذاری دادههاست. در روشهای معمول «یادگیری فعال» (Active Learning)، مدلها گاهی دادههای تکراری (مثل چرخشهای یک تصویر) را به اشتباه به عنوان نمونههای جدید میبینند و بودجه را هدر میدهند.
محققان در پژوهشی جدید، فریمورک GRINCO را معرفی کردهاند که با درک «تقارنهای داده»، از انتخاب نمونههای مشابه و تکراری جلوگیری میکند. این روش با استفاده از فضای کوشنت (Quotient Space)، دادهها را به جای نمونههای خام، بر اساس ویژگیهای اصلی دستهبندی میکند که باعث افزایش چشمگیر کارایی و دقت در یادگیری مدلها میشود. این دستاورد میتواند تحولی در پروژههایی با حجم عظیم دادههای بصری ایجاد کند! 📊💡
منبع: arXiv Machine Learning
