مدلهای چندوجهی (VLMs) همیشه با چالش حجم بالای دادههای تصویری و نویز متنی دست و پنجه نرم میکنند. حالا محققان فریمورک جدیدی به نام EADP معرفی کردهاند که با استفاده از «آنتروپی»، نویزهای مزاحم متنی را فیلتر کرده و تنها اطلاعات مهم و کلیدی تصویر را حفظ میکند.
این روش نه تنها سرعت پردازش مدل را به شدت افزایش میدهد، بلکه باعث میشود هوش مصنوعی در دستورات پیچیده و جزئیات دقیق بصری، بسیار هوشمندتر عمل کند. این یعنی دقت بالاتر در کنار مصرف منابع کمتر! ⚡️
منبع: arXiv AI



