محققان در مقاله جدید خود، روشی نوآورانه برای «ادغام مدلها» (Model Merging) ارائه کردهاند. در این روش، به جای آموزشهای سنگین و دادهمحور، از رویکرد «استنتاج احتمالی» استفاده شده است.
این تیم با الهام از مدلهای انرژیمحور (EBM) و استفاده از توزیعهای سنگیندم (Cauchy)، توانستهاند محدودیتهای روشهای قبلی را کنار بزنند و دقت مدلهای ترکیبی را به شکل چشمگیری افزایش دهند. اگر در حوزه توسعه مدلهای هوش مصنوعی فعال هستید، این رویکرد جدید که کدهای آن نیز منتشر شده، میتواند ابزار بسیار قدرتمندی در جعبهابزار شما باشد! 🛠️💡
منبع: arXiv AI



