مدلهای ترنسفورمر که این روزها دنیای هوش مصنوعی را تسخیر کردهاند، در تحلیل دادههای پیچیده «گراف» (مانند شبکههای اجتماعی یا ساختارهای مولکولی) چالشهایی داشتند. حالا محققان با معرفی معماری X-LogSMask راهکار جالبی ارائه دادند.
این روش با اعمال یک ماسک ساختاریافته روی توجه (Attention) مدل، به آن کمک میکند تا به جای تمرکز بیهدف، دقیقاً روی اتصالات و توپولوژی گراف متمرکز شود. نتیجه؟ افزایش دقت چشمگیر در ۱۳ بنچمارک معتبر و کارایی بسیار بالاتر در مدلهای سبک!
این یعنی قدمی بزرگ برای درک بهتر دادههای غیرساختاریافته توسط مدلهای هوش مصنوعی. 🧠✨
منبع: arXiv AI



