محققان در مقاله جدیدی پرده از یک واقعیت جالب برداشتند: بسیاری از مدلهای زبانی پیشرفته (مانند مدلهای انتشار پیوسته) به دلیل ساختار بازخورد خود، تمایل شدیدی به «تکرار» کلمات دارند. جالبتر اینکه معیارهای سنتی مثل «Perplexity» هم متوجه این تکرار نمیشوند و به جای جریمه کردن، امتیاز بالایی به این مدلهای تکراری میدهند!
💡 خبر خوب این است که محققان روشی به نام «ACE» (Attractor-Contrast-Escape) ابداع کردهاند که با شناسایی و حذف یک جهت خاص در محاسبات، بدون آسیب زدن به کیفیت خروجی، تکرار مدل را تا حد زیادی کاهش میدهد. این روش نهتنها کیفیت را حفظ میکند، بلکه تولید متن انسانی را تا ۵ برابر ارزانتر و سریعتر کرده است.
تکنولوژی هوش مصنوعی هر روز در حال دقیقتر شدن است، و این ابزارها کمک میکنند تا خروجیهای مدلها طبیعیتر و کاربردیتر از همیشه باشد. نظر شما چیست؟ آیا هوش مصنوعی بالاخره از شر «تکرارهای بیهوده» خلاص میشود؟
منبع: arXiv NLP
