آیا «وکتورهای هدایتگر» (Steering Vectors) واقعاً روشی بینقص برای کنترل خروجی مدلهای هوش مصنوعی هستند؟ یک تحقیق جدید در arXiv به بررسی دقیق این تکنیک پرداخته است.
محققان با آزمایش مدلهای قدرتمندی مثل Qwen2.5 و Llama3.1 متوجه شدند که:
🔹 تأثیر متفاوت: اثربخشی این وکتورها برای ویژگیهای مختلف رفتاری بسیار متغیر است.
🔹 چالش انتقال: انتقال وکتورهای استخراجشده به وظایف مختلف (مانند خلاصهسازی یا نوشتن ایمیل) همیشه به خوبی جواب نمیدهد و کارایی آنها کاهش مییابد.
🔹 مشکل ترکیب: هنگام ترکیب چندین وکتور هدایتگر، بین «انسجام متن» و «دقت ویژگی»، تضادی ایجاد میشود که نیاز به تنظیمات دستی پیچیده دارد.
نتیجه این پژوهش نشان میدهد که اگرچه وکتورهای هدایتگر ابزارهای جذابی هستند، اما هنوز برای تبدیل شدن به راهکاری همهجانبه در همسوسازی مدلها با سلیقه کاربر، مسیر زیادی در پیش دارند.
منبع: arXiv NLP



