آیا تا به حال فکر کردهاید که پشت پرده مدلهای بزرگ زبانی (LLM) چه ساختاری نهفته است؟ با وجود اینکه شرکتها جزئیات معماری مدلهای خود را مخفی نگه میدارند، محققان ابزار جدیدی به نام NightVision ساختهاند.
این ابزار حتی با محدودترین دسترسیهای API، میتواند پارامترهای کلیدی مثل ابعاد لایهها، عمق مدل و تعداد پارامترهای یک مدل «جعبهسیاه» را تا حد زیادی تخمین بزند. این یعنی امنیت و محرمانگی ساختار مدلهای تجاری با چالشهای جدی جدیدی روبرو شده است! 🛡️⚙️
منبع: arXiv AI



