⚠️ وقتی مدل‌های هوشمندتر، در کار ابزارها اختلال ایجاد می‌کنند!

خلاصه‌ی فارسی توسط رصد

یک چالش عجیب برای توسعه‌دهندگان پیش آمده: بررسی‌های جدید نشان می‌دهد مدل‌های قدرتمند و جدیدتر کلود (مثل Opus 4.8 و Sonnet 5) در استفاده از ابزارهای کدنویسیِ غیربومی، دچار اشتباهات عجیبی می‌شوند.

ماجرا اینجاست که این مدل‌ها به‌دلیل آموزش‌های اختصاصی روی ابزارهای «کلود کد»، عادت کرده‌اند از ساختارهای خاص خودشان استفاده کنند. حالا وقتی آن‌ها را با ابزارهای دیگری (مثل Pi) به کار می‌گیرید، مدل‌ها پارامترهای اضافی و خودساخته‌ای به درخواست‌ها اضافه می‌کنند که باعث خطای ابزار و رد شدن دستورات می‌شود.

این یعنی همیشه «باهوش‌تر بودن» مدل به معنای سازگاری بهتر با تمام ابزارهای جانبی نیست و گاهی ابزارهای قدیمی‌تر در اجرای دقیق اسکیماها، قابل‌اعتمادتر عمل می‌کنند! 🧐

‌نویسی

منبع: Simon Willison’s Blog