رفتن به محتوا

⌁

اخبار هوش مصنوعی

تازه‌ها
ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

جستجو

13 تیر 1405 · 14:33

🚀 بهینه‌سازی آموزش مدل‌های هوش مصنوعی با روشی جدید!

خلاصه‌ی فارسی توسط رصد

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در مقاله جدیدی راهکاری ارائه داده‌اند که مشکل «اندازه بچ» (Batch Size) در آموزش مدل‌های بزرگ را به شکلی متفاوت حل می‌کند.

تا امروز، تنظیم اندازه بچ برای بهینه‌سازهایی مثل Signum یا Muon (که در مدل‌های پیشرفته‌ای مثل Llama استفاده می‌شوند) معمولاً دستی و هزینه‌بر بود. اما این روش جدید با استفاده از «مقیاس‌های نویز گرادیان غیر-اقلیدسی»، به مدل اجازه می‌دهد به صورت خودکار و هوشمند اندازه بچ را تنظیم کند.

نتایج فوق‌العاده است: تا ۶۶٪ کاهش در گام‌های آموزشی بدون افت عملکرد! این یعنی صرفه‌جویی عظیم در زمان و قدرت پردازشی برای توسعه‌دهندگان مدل‌های زبانی.

‌های_زبانی ‌نویسی

منبع: arXiv AI

مرتبط — همین موضوع

💻 معرفی microide؛ محیط برنامه‌نویسی اختصاصی برای ایجنت‌های هوش مصنوعی!
📚 دایره‌المعارف اصطلاحات برنامه‌نویسی هوش مصنوعی؛ یادگیری سریع مفاهیم پیچیده!
📜 سیاست‌های جدید OpenAPI برای عصر هوش مصنوعی

⌁

اخبار هوش مصنوعی

رصدِ روزانه‌ی خبرهای هوش مصنوعی از منابع بین‌المللی، خلاصه‌شده به فارسی و همراه با ذکر منبع.

دسته‌ها

ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

دنبال کنید

تماس

شماره تماس