مدلهای Diffusion Transformer (DiTs) مثل FLUX یا CogVideoX به شدت سنگین هستند و اجرای آنها هزینههای محاسباتی بالایی دارد. حالا محققان متد جدیدی به نام «OrbitQuant» معرفی کردهاند که بدون نیاز به دادههای آموزشی خاص (Data-Agnostic)، وزنها و فعالسازیهای این مدلها را فشرده (Quantize) میکند.
✨ چرا این خبر مهم است؟
با استفاده از این روش، میتوان مدلهای بزرگ تصویر و ویدیو را با دقت بسیار بالا به نسخههای سبکتر تبدیل کرد؛ تا جایی که حتی در نرخهای W2A4 هم کیفیت خروجی همچنان کاربردی باقی میماند. این یعنی در آینده نه چندان دور، اجرای مدلهای پیشرفته تولید ویدیو روی سختافزارهای ضعیفتر ممکنتر میشود!
منبع: arXiv AI



