🚀 انقلابی در اجرای مدل‌های زبانی: موتور استنتاج جدید با Rust! 🦀

خلاصه‌ی فارسی توسط رصد

اگر در دنیای LLMها فعالیت می‌کنید، حتماً با چالش‌های حافظه و سخت‌افزار برای اجرای مدل‌ها آشنا هستید. به تازگی پروژه‌ای متن‌باز به نام «Kortex» معرفی شده که یک موتور استنتاج (Inference Engine) فوق‌العاده سریع و بهینه است که کاملاً از صفر با زبان Rust نوشته شده.

ویژگی کلیدی این ابزار، قابلیت Out-of-core است؛ یعنی اجازه می‌دهد مدل‌هایی را اجرا کنید که بزرگتر از حافظه گرافیکی (VRAM) سیستم شما هستند. این یک خبر عالی برای توسعه‌دهندگانی است که می‌خواهند مدل‌های سنگین را روی سخت‌افزارهای معمولی با بازدهی بالا تست کنند.

خوشحالیم که می‌بینیم اکوسیستم Rust روز به روز نقش پررنگ‌تری در سرعت بخشیدن به هوش مصنوعی ایفا می‌کند.

🔗 مشاهده پروژه در گیت‌هاب

，

منبع: Hacker News LLM