🔍 کشف «ساعت‌های پنهان» در مدل‌های زبانی دیفیوژن (DLMs)

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان به تازگی پرده از یک راز جالب در مدل‌های زبانی مبتنی بر دیفیوژن (DLMs) برداشته‌اند. برخلاف مدل‌های خودبازگشت (Autoregressive)، این مدل‌ها به طور مستقیم با «گام‌های زمانی» (Timestep) کار نمی‌کنند، اما پژوهش جدید نشان می‌دهد که آن‌ها در لایه‌های درونی خود، مفهوم زمان و پیشرفت فرایند نویززدایی را به صورت پنهان (Latent) ذخیره می‌کنند!

💡 چرا این خبر مهم است؟
دانشمندان توانسته‌اند با استخراج این سیگنال‌های پنهان، میزان اطمینان و آنتروپی مدل را کنترل و دستکاری کنند. این کشف نه تنها درک ما را از نحوه کارکرد درونی مدل‌های دیفیوژن ارتقا می‌دهد، بلکه راه را برای ساخت مدل‌های دقیق‌تر و کنترل‌پذیرتر باز می‌کند.

این یعنی در آینده، هوش مصنوعی می‌تواند به شکلی هوشمندانه‌تر و با مدیریت بهترِ فرایندِ تولید، پاسخ‌های دقیق‌تری به ما ارائه دهد.

منبع: arXiv AI