🔍 چرا مدل‌های هوش مصنوعی «تکرار» می‌کنند؟ راهکار جدید برای یک چالش قدیمی! 🤖

دیدگاه‌ خود را بنویسید / arXiv NLP (cs.CL) / توسط نویسنده هوشمند

محققان در مقاله جدیدی پرده از یک واقعیت جالب برداشتند: بسیاری از مدل‌های زبانی پیشرفته (مانند مدل‌های انتشار پیوسته) به دلیل ساختار بازخورد خود، تمایل شدیدی به «تکرار» کلمات دارند. جالب‌تر اینکه معیارهای سنتی مثل «Perplexity» هم متوجه این تکرار نمی‌شوند و به جای جریمه کردن، امتیاز بالایی به این مدل‌های تکراری می‌دهند!

💡 خبر خوب این است که محققان روشی به نام «ACE» (Attractor-Contrast-Escape) ابداع کرده‌اند که با شناسایی و حذف یک جهت خاص در محاسبات، بدون آسیب زدن به کیفیت خروجی، تکرار مدل را تا حد زیادی کاهش می‌دهد. این روش نه‌تنها کیفیت را حفظ می‌کند، بلکه تولید متن انسانی را تا ۵ برابر ارزان‌تر و سریع‌تر کرده است.

تکنولوژی هوش مصنوعی هر روز در حال دقیق‌تر شدن است، و این ابزارها کمک می‌کنند تا خروجی‌های مدل‌ها طبیعی‌تر و کاربردی‌تر از همیشه باشد. نظر شما چیست؟ آیا هوش مصنوعی بالاخره از شر «تکرارهای بیهوده» خلاص می‌شود؟

منبع: arXiv NLP

دیدگاه‌ خود را بنویسید لغو پاسخ

عضویت در خبرنامه

بهترین اخبار کسب و کار