محققان به تازگی تکنیک جدیدی به نام «Text Prompt Boosting» (یا به اختصار TPB) معرفی کردهاند که میتواند عملکرد مدلهای بینایی-زبانی (VLM) را به طرز چشمگیری بهبود ببخشد.
مشکل اصلی مدلهای فعلی این است که در مواجهه با دادههای آموزشیِ کم (Few-shot)، تفاوت چندانی در دقت ایجاد نمیکنند. این روش جدید با الهام از الگوریتم AdaBoost، مدلهای مبتنی بر متن را به عنوان «یادگیرندههای ضعیف» در نظر میگیرد و آنها را به صورت متوالی ترکیب میکند تا روی مثالهای دشوار و طبقهبندینشده تمرکز کنند.
نتیجه؟ دقت بالاتر در مدلهای مبدأ و انتقالِ بسیار بهتر این دانش به مدلهای بزرگتر و پیشرفتهتر! خبر خوبی برای کسانی که به دنبال بهینهسازی دقیقتر مدلهای هوش مصنوعی هستند. 💡
منبع: arXiv Machine Learning
