رفتن به محتوا

⌁

اخبار هوش مصنوعی

تازه‌ها
ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

جستجو

13 تیر 1405 · 19:01

🚀 بهینه‌سازی مدل‌های غول‌آسا: معرفی متد جدید برای هرس هوشمند MoE

خلاصه‌ی فارسی توسط رصد

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

مدل‌های زبانی با معماری Mixture-of-Experts (MoE) به دلیل حجم بالا همیشه چالشی برای سخت‌افزارها بوده‌اند. حالا محققان متد جدیدی به نام «Generic TB-Coverage» معرفی کرده‌اند که اجازه می‌دهد بدون نیاز به داده‌های کالیبراسیون پیچیده و اختصاصی، این مدل‌ها را به شکل بهینه‌ای هرس (Pruning) کنید.

این روش با تحلیل هوشمندانه داده‌های عمومی، متخصص‌های (Experts) حیاتی مدل را شناسایی و حفظ می‌کند تا در کنار کاهش وزن مدل، دقت آن به شدت حفظ شود. این دستاورد، به خصوص برای مدل‌های بزرگی مثل Qwen و DeepSeek در شرایط فشرده‌سازی سنگین، نتایج درخشانی نشان داده است. 🧠✨

منبع: arXiv AI

مرتبط — همین موضوع

💻 معرفی microide؛ محیط برنامه‌نویسی اختصاصی برای ایجنت‌های هوش مصنوعی!
📚 دایره‌المعارف اصطلاحات برنامه‌نویسی هوش مصنوعی؛ یادگیری سریع مفاهیم پیچیده!
📜 سیاست‌های جدید OpenAPI برای عصر هوش مصنوعی

⌁

اخبار هوش مصنوعی

رصدِ روزانه‌ی خبرهای هوش مصنوعی از منابع بین‌المللی، خلاصه‌شده به فارسی و همراه با ذکر منبع.

دسته‌ها

ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

دنبال کنید

تماس

شماره تماس