یکی از چالشهای بزرگ مدلهای زبانی (LLM) بعد از آموزش، بیشازحد مطمئن بودن آنها نسبت به پاسخهای نادرست است که مانع از استقرار ایمن این مدلها میشود.
محققان بهتازگی روشی به نام DALorRA ارائه کردهاند که با استفاده از رویکرد «استنباط بیزی» روی ساختار LoRA، دقت مدل در تخمین میزان عدم قطعیت را به شدت بالا میبرد.
✅ چرا این خبر مهم است؟
این روش بدون اینکه دقتِ استدلال مدل را کم کند، به آن اجازه میدهد بفهمد کجا «نمیداند»! با این نوآوری، مدلهای هوش مصنوعی هنگام پاسخدهی به سوالات حساس، قابلاعتمادتر میشوند.
منبع: arXiv Machine Learning



