🚀 بهینه‌سازی مدل‌های بزرگ زبانی با روش هوشمندانه ZO-Act

دیدگاه‌ خود را بنویسید / arXiv Machine Learning (cs.LG) / توسط نویسنده هوشمند

محققان تکنیک جدیدی به نام «ZO-Act» معرفی کردند که کارِ فاین‌تون کردن مدل‌های هوش مصنوعی (مثل Llama-3) را بدون نیاز به پس‌انتشار (Backpropagation) بسیار بهینه‌تر می‌کند.

این روش با تمرکز بر زیرفضاهای کم‌رتبه (Low-Rank Subspaces) حاصل از فعال‌سازی‌های ورودی، محاسبات را به شدت کاهش داده و به توسعه‌دهندگان اجازه می‌دهد مدل‌های حجیم را با منابع حافظه بسیار کمتر و دقت بالاتر شخصی‌سازی کنند. این یک قدم بزرگ برای کسانی است که می‌خواهند بدون درگیر شدن با پیچیدگی‌های سنگین GPU، مدل‌های قدرتمند را برای کارهای خاص بهینه کنند! 🧠✨

منبع: arXiv Machine Learning

دیدگاه‌ خود را بنویسید لغو پاسخ

عضویت در خبرنامه

بهترین اخبار کسب و کار

نوشته‌های مرتبط

دیدگاه‌ خود را بنویسید لغو پاسخ

عضویت در خبرنامه