🚀 بهینه‌سازی خیره‌کننده در مدل‌های MoE: معرفی روش EPnG

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در مقاله‌ای جدید از روش نوآورانه EPnG رونمایی کرده‌اند که انقلابی در نحوه تنظیم دقیق (Fine-tuning) مدل‌های Mixture-of-Experts (MoE) ایجاد می‌کند.

چرا این خبر مهم است؟
روش‌های فعلی مانند LoRA در مدل‌های MoE چندان بهینه نیستند، اما EPnG با تحلیل هوشمندانه ترافیک مسیریابی (Routing)، تخصصِ «کارشناسان» (Experts) مدل را به صورت خودکار pruned و expand می‌کند.

نتیجه؟ این متد جدید با آپدیت کردن تنها ۰.۵۵ تا ۰.۷۲ درصد از پارامترها، عملکردی مشابه با تنظیم دقیق کامل کل مدل ارائه می‌دهد که تا ۱۸۰ برابر بهینه‌تر از روش‌های معمول است. این یعنی کاهش هزینه‌های سنگینِ آموزش مدل‌های بزرگ بدون افت کیفیت!

منبع: arXiv AI