محققان در یک دستاورد تازه، بنچمارک جدیدی به نام «RusFinChain» را برای ارزیابی قابلیت استدلال مرحلهبهمرحله (CoT) مدلهای زبانی در حوزه مالی به زبان روسی معرفی کردند.
این بنچمارک شامل ۵۲۸۰ نمونه داده تخصصی است که به مدلها کمک میکند نه تنها جواب نهایی، بلکه روند محاسباتی و منطقی خود را نیز اصلاح کنند. نتایج این بررسی نشان میدهد که مدلهای هوش مصنوعی فعلی هنوز در استدلالهای دقیق مالی با چالشهای جدی روبرو هستند. این ابزار میتواند گامی مهم برای توسعه مدلهای مالی قابلاعتمادتر باشد. 📈
های_زبانی
منبع: arXiv NLP



