🎨 خلاقیت هوش مصنوعی را چطور اندازه بگیریم؟ معرفی CreativityPrism

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

تا حالا فکر کردید مدل‌های زبانی (LLM) چقدر واقعاً «خلاق» هستند؟ تا امروز روش‌های ارزیابی خلاقیت هوش مصنوعی خیلی پراکنده یا وابسته به قضاوت انسانی بودند، اما فریم‌ورک جدید CreativityPrism این وضعیت را تغییر داده است! 🧠✨

این پروژه با بررسی ۸ تسک مختلف در حوزه‌های «تفکر واگرا»، «نوشتن خلاقانه» و «استدلال منطقی»، توانایی مدل‌ها را در سه بعدِ کیفیت، نوآوری و تنوع می‌سنجد. جالب است بدانید که در ارزیابی ۱۷ مدل پیشرو، مشخص شد مدل‌های بزرگ‌تر در نوشتن و استدلال عالی هستند، اما در «تفکر واگرا» تفاوت معناداری با مدل‌های کوچک‌تر ندارند! 📊

این یعنی هوش مصنوعی هنوز در دنیای خلاقیت، چالش‌های جالبی برای پیمودن دارد.

منبع: arXiv AI