🚀 بهینه‌سازی خیره‌کننده در مدل‌های مولد ویدیو و تصویر با OrbitQuant!

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

مدل‌های Diffusion Transformer (DiTs) مثل FLUX یا CogVideoX به شدت سنگین هستند و اجرای آن‌ها هزینه‌های محاسباتی بالایی دارد. حالا محققان متد جدیدی به نام «OrbitQuant» معرفی کرده‌اند که بدون نیاز به داده‌های آموزشی خاص (Data-Agnostic)، وزن‌ها و فعال‌سازی‌های این مدل‌ها را فشرده (Quantize) می‌کند.

چرا این خبر مهم است؟
با استفاده از این روش، می‌توان مدل‌های بزرگ تصویر و ویدیو را با دقت بسیار بالا به نسخه‌های سبک‌تر تبدیل کرد؛ تا جایی که حتی در نرخ‌های W2A4 هم کیفیت خروجی همچنان کاربردی باقی می‌ماند. این یعنی در آینده نه چندان دور، اجرای مدل‌های پیشرفته تولید ویدیو روی سخت‌افزارهای ضعیف‌تر ممکن‌تر می‌شود!

منبع: arXiv AI