🔍 کشف ساختار درونی مدل‌های ترنسفورمر با TGO-II

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان در یک پژوهش علمی جدید، ابزاری به نام «Transformer Geometry Observatory-II» (یا به اختصار TGO-II) را معرفی کرده‌اند که برای درک بهتر نحوه تغییر و تکامل بازنمایی‌های هندسی در مدل‌های «ویژن ترنسفورمر» (ViT) طراحی شده است.

این ابزار با تحلیل دقیق لایه‌های مدل در طول آموزش، سه نکته کلیدی را روشن کرده است:
۱. با پیشرفت آموزش، تخصصی‌سازی لایه‌ها افزایش می‌یابد.
۲. ابعاد درونی بازنمایی‌ها ابتدا افزایش یافته و سپس به ثبات می‌رسد.
۳. ساختار تعامل بین توکن‌ها در طول فرآیند آموزش کاملاً حفظ می‌شود.

این نوع پژوهش‌ها به ما کمک می‌کند تا بفهمیم مدل‌های هوش مصنوعی واقعاً در «ذهن» دیجیتالی خود چه فرآیندهایی را طی می‌کنند تا به نتایج دقیق برسند. 💡

منبع: arXiv Machine Learning