💡 بهینه‌سازی مدل‌های هوش مصنوعی: هرس کردن کارشناسان (MoE) بدون افت دقت!

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

مدل‌های Mixture-of-Experts یا همان MoE به دلیل سرعت بالایشان بسیار محبوب هستند، اما به دلیل حجم زیاد، اجرای آن‌ها روی دستگاه‌های با حافظه محدود چالش‌برانگیز است. محققان در مطالعه جدیدی بررسی کرده‌اند که چگونه می‌توان این مدل‌ها را در حوزه‌های حساسی مثل «پزشکی» هرس (Pruning) کرد تا هم سبک‌تر شوند و هم دقت علمی خود را از دست ندهند.

نتیجه جالب اینجاست: هرس کردنِ متوسط، عملکرد مدل را حفظ می‌کند، اما اگر بیش از حد پیش بروید، احتمال «توهم» (Hallucination) یا همان اطلاعات غلط افزایش می‌یابد. این تحقیق نشان می‌دهد که برای استفاده از هوش مصنوعی در محیط‌های حساس، فقط سرعت کافی نیست و باید «اعتبار و قابلیت اطمینان» مدل را هم به‌دقت زیر نظر داشت. 🩺⚙️

منبع: arXiv AI