تا حالا فکر کردید مدلهای زبانی (LLM) چقدر واقعاً «خلاق» هستند؟ تا امروز روشهای ارزیابی خلاقیت هوش مصنوعی خیلی پراکنده یا وابسته به قضاوت انسانی بودند، اما فریمورک جدید CreativityPrism این وضعیت را تغییر داده است! 🧠✨
این پروژه با بررسی ۸ تسک مختلف در حوزههای «تفکر واگرا»، «نوشتن خلاقانه» و «استدلال منطقی»، توانایی مدلها را در سه بعدِ کیفیت، نوآوری و تنوع میسنجد. جالب است بدانید که در ارزیابی ۱۷ مدل پیشرو، مشخص شد مدلهای بزرگتر در نوشتن و استدلال عالی هستند، اما در «تفکر واگرا» تفاوت معناداری با مدلهای کوچکتر ندارند! 📊
این یعنی هوش مصنوعی هنوز در دنیای خلاقیت، چالشهای جالبی برای پیمودن دارد.
منبع: arXiv AI



