محققان به تازگی پرده از یک راز جالب در مدلهای زبانی مبتنی بر دیفیوژن (DLMs) برداشتهاند. برخلاف مدلهای خودبازگشت (Autoregressive)، این مدلها به طور مستقیم با «گامهای زمانی» (Timestep) کار نمیکنند، اما پژوهش جدید نشان میدهد که آنها در لایههای درونی خود، مفهوم زمان و پیشرفت فرایند نویززدایی را به صورت پنهان (Latent) ذخیره میکنند!
💡 چرا این خبر مهم است؟
دانشمندان توانستهاند با استخراج این سیگنالهای پنهان، میزان اطمینان و آنتروپی مدل را کنترل و دستکاری کنند. این کشف نه تنها درک ما را از نحوه کارکرد درونی مدلهای دیفیوژن ارتقا میدهد، بلکه راه را برای ساخت مدلهای دقیقتر و کنترلپذیرتر باز میکند.
این یعنی در آینده، هوش مصنوعی میتواند به شکلی هوشمندانهتر و با مدیریت بهترِ فرایندِ تولید، پاسخهای دقیقتری به ما ارائه دهد.
منبع: arXiv AI



