رفتن به محتوا

⌁

اخبار هوش مصنوعی

تازه‌ها
ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

جستجو

13 تیر 1405 · 22:28

🎙️ تحولی در سنتز گفتار عبری با ابزار Phonikud

خلاصه‌ی فارسی توسط رصد

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

تولید متن به گفتار (TTS) برای زبان‌هایی که پیچیدگی‌های آوانگاری دارند، همیشه یک چالش بوده است. محققان به تازگی سیستم متن‌باز Phonikud را معرفی کرده‌اند که به طور خاص برای رفع مشکلات زیرساختی زبان عبری طراحی شده است.

این پروژه با ارائه یک سیستم مبدل نویسه به واج (G2P)، پایگاه داده جدید ILSpeech و مدل‌های بهبودیافته برای تولید آوا، توانسته کیفیت سنتز گفتار را در مدل‌های کوچک و محلی به سطح مدل‌های بزرگ و تجاری برساند. این دستاورد گام مهمی در دقیق‌تر شدن مدل‌های هوش مصنوعی برای زبان‌هایی با ساختار نوشتاری خاص است.

🔗 لینک پروژه: https://phonikud.github.io

منبع: arXiv NLP

مرتبط — همین موضوع

💻 معرفی microide؛ محیط برنامه‌نویسی اختصاصی برای ایجنت‌های هوش مصنوعی!
📚 دایره‌المعارف اصطلاحات برنامه‌نویسی هوش مصنوعی؛ یادگیری سریع مفاهیم پیچیده!
📜 سیاست‌های جدید OpenAPI برای عصر هوش مصنوعی

⌁

اخبار هوش مصنوعی

رصدِ روزانه‌ی خبرهای هوش مصنوعی از منابع بین‌المللی، خلاصه‌شده به فارسی و همراه با ذکر منبع.

دسته‌ها

ابزارها و نسخه‌های جدید
اخبار شرکت‌ها
تحلیل‌های جامعه فنی
مقالات علمی

دنبال کنید

تماس

شماره تماس