محققان در یک مطالعه تازه نشان دادهاند که تکیه بر دادههای مصنوعی برای آموزش مدلها، اگر با روشهای انتخابی ناقص و محدود (مثلاً در سازمانهای پزشکی یا مالی) ترکیب شود، میتواند منجر به «فروپاشی مدل» (Model Collapse) شود. این یعنی مدل به جای یادگیری بهتر، به مرور «تنوع» خود را از دست داده و خروجیهای همگن و بیکیفیتی تولید میکند.
نکته کلیدی اینجاست: وقتی انتخاب دادهها بر اساس دیدگاههای محلی و محدود (Siloed) انجام شود، مدل به جای جلوگیری از فروپاشی، عملاً آن را تسریع میکند! راهکار پیشنهادی؟ استفاده از «پراکسیهای مشارکتی» برای حفظ تنوع دادهها بدون نیاز به به اشتراکگذاری دادههای خام.
این تحقیق اهمیت دقت در تامین دادههای آموزشی را بیش از پیش نمایان میکند. نظر شما چیست؟ آیا آینده هوش مصنوعی در دادههای مصنوعی خلاصه میشود؟
منبع: arXiv AI



