آیا هوش مصنوعی میتواند جای استاد را در تصحیح برگههای امتحانی بگیرد؟ محققان در مطالعه اخیر خود، عملکرد مدلهای بزرگ زبانی (LLM) مانند GPT، Claude و Gemini را برای تصحیح آزمونهای تخصصی لینوکس و بش (Bash) بررسی کردند.
نتایج این تحقیق نشان میدهد که مدلها، بهویژه «Gemini 3.0 Pro»، با استفاده از دستورالعملهای دقیق (Rubrics)، توانستهاند عملکردی بسیار نزدیک به اساتید خبره داشته باشند. البته این دقت با افزایش پیچیدگی سوالات (از دستورات ساده تا مدیریت پیشرفته سیستم) کاهش مییابد.
این خبر نویدبخش تحولی بزرگ در سیستمهای آموزشی است که میتواند بار سنگین تصحیح پاسخهای تشریحی را از دوش اساتید برداشته و بازخورد سریعتری به دانشجویان ارائه دهد. ✅
منبع: arXiv AI



