محققان به تازگی از مدل جدیدی به نام BamiBERT رونمایی کردند که ادعا میکند محدودیتهای مدل محبوب قبلی یعنی PhoBERT را کنار زده است. 🧠
ویژگیهای جذاب این مدل:
✅ آموزشدیده روی حجم عظیمی از دادههای متنی (۱۲۹ گیگابایت).
✅ پشتیبانی از طول متن (Context Length) تا ۲۰۴۸ توکن.
✅ حذف نیاز به پیشپردازشهای پیچیده (word segmentation) و کار مستقیم روی متن خام.
این مدل جدید توانسته در اکثر بنچمارکهای زبان ویتنامی، رکورد جدیدی را ثبت کند و به عنوان یک مدل پایه (Base-sized) بسیار قدرتمند شناخته شود. دسترسی به این مدل هماکنون از طریق Hugging Face برای توسعهدهندگان امکانپذیر است. اگر روی مدلهای چندزبانه کار میکنید، بررسی معماری این مدل میتواند بسیار الهامبخش باشد!
🔗 دسترسی به BamiBERT در Hugging Face
منبع: arXiv NLP



