🤖 تصحیح خودکار آزمون‌های برنامه‌نویسی با هوش مصنوعی!

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

آیا هوش مصنوعی می‌تواند جای استاد را در تصحیح برگه‌های امتحانی بگیرد؟ محققان در مطالعه اخیر خود، عملکرد مدل‌های بزرگ زبانی (LLM) مانند GPT، Claude و Gemini را برای تصحیح آزمون‌های تخصصی لینوکس و بش (Bash) بررسی کردند.

نتایج این تحقیق نشان می‌دهد که مدل‌ها، به‌ویژه «Gemini 3.0 Pro»، با استفاده از دستورالعمل‌های دقیق (Rubrics)، توانسته‌اند عملکردی بسیار نزدیک به اساتید خبره داشته باشند. البته این دقت با افزایش پیچیدگی سوالات (از دستورات ساده تا مدیریت پیشرفته سیستم) کاهش می‌یابد.

این خبر نویدبخش تحولی بزرگ در سیستم‌های آموزشی است که می‌تواند بار سنگین تصحیح پاسخ‌های تشریحی را از دوش اساتید برداشته و بازخورد سریع‌تری به دانشجویان ارائه دهد. ✅

منبع: arXiv AI