محققان در یک پژوهش جدید، روشی نوآورانه برای «طبقهبندی صدای چند-نمونهای در محیط باز» (Few-Shot Open-Set Audio Classification) ارائه کردهاند.
مشکل بسیاری از سیستمهای فعلی این است که صداهای ناشناخته را به اشتباه در دستهبندیهای قبلی خود جای میدهند؛ اما این مدل جدید با استفاده از معماری مبتنی بر توجه (Attention)، میتواند علاوه بر شناسایی دقیق اصوات، صداهای خارج از کلاسهای تعریفشده را هم به درستی تشخیص داده و رد کند. این دستاورد گام مهمی برای سیستمهای پردازش صوتی هوشمند است که باید در دنیای واقعی با دادههای پیشبینینشده مواجه شوند. 🔊🤖
منبع: arXiv Machine Learning



