Using SVM in Transliteration from Latin into Cyrillic Mongolian

Хэвлэлийн нэр: Proceedings of the 6th International Conference FITAT 2013 and 3rd International Symposium ISPM 2013

Зохиогч:  А.Хүдэр

Хамтран зохиогч: Б. Батзолбоо

Хэвлүүлсэн огноо: 2013-10-28

Хуудас дугаар: 24

Өгүүллийн хураангуй: Although the official alphabet in Mongolia is Cyrillic, many young people use Latin alphabet in mobile messages, online blog comments, and TV chat programs. Volume of Mongolian context in Latin alphabet sometimes prevail official Cyrillic context volume. This paper evaluates traditional table matching method on Latin – Mongolian transliteration problem and proposes a new method using SVM POS tagger. We used some special corpus design to avoid chunking problem. The results were much higher than the traditional method’s results due to its machine learning components (Support Vector Machine).

Өгүүллийн төрөл: Олон улсын хурлын эмхэтгэлд бүрэн хэмжээний өгүүлэл

Өгүүллийн зэрэглэл: Гадаад

Түлхүүр үг:

Өгүүлэл нэмсэн: А.Хүдэр

Монгол Улсын Шинжлэх Ухаан Технологийн Их Сургууль © 2019