مدلهای بزرگ بینایی-زبانی (LVLMs) فوقالعاده قدرتمندند، اما به دلیل حجم عظیم پارامترها، اجرای آنها روی دستگاههای معمولی بسیار سخت و کند است.
محققان در مقاله جدیدی از تکنیک SAB-LVLM رونمایی کردهاند که با استفاده از «باینریسازیِ آگاه از اهمیت» (Significance-Aware Binarization)، مشکل اصلیِ افت کیفیت در مدلهای فشردهسازی شده را حل میکند. این روش با شناسایی وزنهای حیاتی در لایههای مختلف و مدالیتههای متفاوت (تصویر و متن)، به مدل اجازه میدهد بدون فدا کردن دقت، حجم و سرعت پردازش را به شدت کاهش دهد.
این یک گام مهم برای اجرای مدلهای هوش مصنوعی پیشرفته روی گوشیها و دستگاههای با سختافزار محدود است! 📱💡
منبع: arXiv AI



