دانشمندان در مقاله علمی جدیدی، به سراغ یکی از موضوعات داغ دنیای LLMها رفتهاند: واترمارکگذاری! واترمارکها به ما کمک میکنند بفهمیم یک متن چقدر توسط هوش مصنوعی تولید شده است.
نکته جالب اینجاست که پژوهشگران ثابت کردند روش فعلی یعنی «کاهش به آمار محوری» (Pivotal Reduction) علیرغم محبوبیت زیاد، همیشه بهینه نیست و برای تخمین دقیقترِ سهم هوش مصنوعی در یک متن، روشهای جدیدی مثل «شمارش رویداد» (Event-counting) میتوانند بسیار کارآمدتر باشند.
اگر در حوزه امنیت، تشخیص محتوای AI یا مدلهای زبانی فعالیت میکنید، این دستاوردهای ریاضیاتی در ارتقای دقت سیستمهای تشخیص تقلب بسیار کلیدی هستند. 📊🤖
منبع: arXiv Machine Learning
