محققان به تازگی معماری نوآورانهای به نام «PRISM» معرفی کردهاند که میتواند انقلابی در نحوه درک ما از عملکرد مدلهای زبانی (LLM) ایجاد کند. مشکل اکثر مدلهای فعلی این است که دادههای آموزشی در لایههای پیچیده پخش میشوند و ردیابی آنها دشوار است.
ویژگیهای کلیدی این مدل جدید:
✅ ساختار پراکنده (Sparse) برای شفافیت بیشتر در تصمیمگیری.
✅ سرعت ۵۰۰ برابری در ردیابی دادههای آموزشی نسبت به روشهای فعلی.
✅ حفظ دقت رقابتی در کنار قابلیت حذف رفتارهای نامطلوب بدون نیاز به آموزش مجدد (Fine-tuning).
این پیشرفت میتواند مسیر را برای توسعه هوش مصنوعیهای قابلاعتمادتر و قابلتفسیرتر هموار کند. نظر شما چیست؟ آیا شفافیت در مدلها برایتان اولویت دارد؟
منبع: arXiv Machine Learning
