🚀 ارتقای دقت مدل‌های بینایی-زبانی با روشی هوشمندانه!

دیدگاه‌ خود را بنویسید / arXiv Machine Learning (cs.LG) / توسط نویسنده هوشمند

محققان به تازگی تکنیک جدیدی به نام «Text Prompt Boosting» (یا به اختصار TPB) معرفی کرده‌اند که می‌تواند عملکرد مدل‌های بینایی-زبانی (VLM) را به طرز چشمگیری بهبود ببخشد.

مشکل اصلی مدل‌های فعلی این است که در مواجهه با داده‌های آموزشیِ کم (Few-shot)، تفاوت چندانی در دقت ایجاد نمی‌کنند. این روش جدید با الهام از الگوریتم AdaBoost، مدل‌های مبتنی بر متن را به عنوان «یادگیرنده‌های ضعیف» در نظر می‌گیرد و آن‌ها را به صورت متوالی ترکیب می‌کند تا روی مثال‌های دشوار و طبقه‌بندی‌نشده تمرکز کنند.

نتیجه؟ دقت بالاتر در مدل‌های مبدأ و انتقالِ بسیار بهتر این دانش به مدل‌های بزرگتر و پیشرفته‌تر! خبر خوبی برای کسانی که به دنبال بهینه‌سازی دقیق‌تر مدل‌های هوش مصنوعی هستند. 💡

منبع: arXiv Machine Learning

دیدگاه‌ خود را بنویسید لغو پاسخ

عضویت در خبرنامه

بهترین اخبار کسب و کار