محققان NAVER LABS Europe در تازهترین دستاورد خود برای مسابقات IWSLT 2026، سیستمی هوشمند توسعه دادهاند که در پردازش دستورات گفتاری (Instruction-following) فوقالعاده عمل کرده است. این مدل که به صورت مشترک کارهای تشخیص گفتار (ASR)، ترجمه (ST) و پاسخ به سوالات (SQA) را به زبانهای انگلیسی، چینی، ایتالیایی و آلمانی انجام میدهد، توانسته با استفاده از تکنیک جدید «SpeechMapper» و دادههای مصنوعی خاص، رتبه نخست این رقابتها را کسب کند.
نکته جذاب این پژوهش، کارایی بسیار بالای مدل در عین کمحجم بودن آن است که نشان میدهد با استراتژیهای هوشمندانه، نیازی به مدلهای عظیم و سنگین برای رسیدن به نتایج برتر نیست. آینده دستیارهای صوتی بیش از پیش به سمت دقت و هوشمندی در حرکت است! 🎙️✨
منبع: arXiv NLP



