📜 گامی بزرگ در پردازش زبان‌های باستانی با هوش مصنوعی

⚠️ هشدار به محققان: چرا دقت مدل‌های شناسایی پهپاد گاهی «واقعی» نیست؟

محققان به تازگی از یک پروژه متن‌باز و جذاب به نام AthDGC رونمایی کرده‌اند که برای نخستین بار یک مجموعه داده عظیم و ساختاریافته (Treebank) از زبان یونانی در ۸ دوره تاریخی مختلف (از آرکائیک تا مدرن) ایجاد کرده است.

این پروژه که با استفاده از مدل‌های پیشرفته هوش مصنوعی نظیر Stanza، LaBSE و mBERT توسعه یافته، نه تنها زبان یونانی را تحلیل می‌کند، بلکه امکان مقایسه آن با زبان‌های باستانی دیگر مثل لاتین، گوتیک و ارمنی را نیز فراهم کرده است. این دستاورد می‌تواند ابزاری کلیدی برای زبان‌شناسان و محققان هوش مصنوعی در حوزه پردازش متون باستانی (NLP) باشد. 🏛️✨

منبع: arXiv NLP