محققان به تازگی از یک پروژه متنباز و جذاب به نام AthDGC رونمایی کردهاند که برای نخستین بار یک مجموعه داده عظیم و ساختاریافته (Treebank) از زبان یونانی در ۸ دوره تاریخی مختلف (از آرکائیک تا مدرن) ایجاد کرده است.
این پروژه که با استفاده از مدلهای پیشرفته هوش مصنوعی نظیر Stanza، LaBSE و mBERT توسعه یافته، نه تنها زبان یونانی را تحلیل میکند، بلکه امکان مقایسه آن با زبانهای باستانی دیگر مثل لاتین، گوتیک و ارمنی را نیز فراهم کرده است. این دستاورد میتواند ابزاری کلیدی برای زبانشناسان و محققان هوش مصنوعی در حوزه پردازش متون باستانی (NLP) باشد. 🏛️✨
منبع: arXiv NLP



