مدلهای Mixture-of-Experts یا همان MoE به دلیل سرعت بالایشان بسیار محبوب هستند، اما به دلیل حجم زیاد، اجرای آنها روی دستگاههای با حافظه محدود چالشبرانگیز است. محققان در مطالعه جدیدی بررسی کردهاند که چگونه میتوان این مدلها را در حوزههای حساسی مثل «پزشکی» هرس (Pruning) کرد تا هم سبکتر شوند و هم دقت علمی خود را از دست ندهند.
نتیجه جالب اینجاست: هرس کردنِ متوسط، عملکرد مدل را حفظ میکند، اما اگر بیش از حد پیش بروید، احتمال «توهم» (Hallucination) یا همان اطلاعات غلط افزایش مییابد. این تحقیق نشان میدهد که برای استفاده از هوش مصنوعی در محیطهای حساس، فقط سرعت کافی نیست و باید «اعتبار و قابلیت اطمینان» مدل را هم بهدقت زیر نظر داشت. 🩺⚙️
منبع: arXiv AI



