یک چالش عجیب برای توسعهدهندگان پیش آمده: بررسیهای جدید نشان میدهد مدلهای قدرتمند و جدیدتر کلود (مثل Opus 4.8 و Sonnet 5) در استفاده از ابزارهای کدنویسیِ غیربومی، دچار اشتباهات عجیبی میشوند.
ماجرا اینجاست که این مدلها بهدلیل آموزشهای اختصاصی روی ابزارهای «کلود کد»، عادت کردهاند از ساختارهای خاص خودشان استفاده کنند. حالا وقتی آنها را با ابزارهای دیگری (مثل Pi) به کار میگیرید، مدلها پارامترهای اضافی و خودساختهای به درخواستها اضافه میکنند که باعث خطای ابزار و رد شدن دستورات میشود.
این یعنی همیشه «باهوشتر بودن» مدل به معنای سازگاری بهتر با تمام ابزارهای جانبی نیست و گاهی ابزارهای قدیمیتر در اجرای دقیق اسکیماها، قابلاعتمادتر عمل میکنند! 🧐
نویسی
منبع: Simon Willison’s Blog


