В Китае запустили высокоточный сервис перевода упрощенных иероглифов в традиционные и наоборот
Традиционный и упрощенный китайский иероглиф (Архивное фото)
В Китае запустили систему, которая может очень точно трансформировать традиционные иероглифы в упрощенные и обратно, что крайне важно для чтения древних текстов и облегчит общение между берегами Тайваньского пролива, а также между материковым Китаем, Сянганом и Аомэнем.
Китайский язык представлен двумя вариантами письменности: традиционными иероглифами и упрощенной иероглификой. Последняя практикуется в основном в материковом Китае и стала популяризоваться еще в 50-е годы ХХ века, тогда как иероглифы в традиционном написании распространены на Тайване, в Сянгане, Аомэне и некоторых других регионах.
Над проектом работали специалисты из Сямэньского университета, Института прикладной лингвистики Министерства образования КНР и Пекинского педагогического университета. Первая версия системы была запущена в ноябре 2014 года. Вторая -- после усовершенствования 30 июня нынешнего года и находится в свободном доступе по адресу http://jf.cloudtranslation.cc/.
Китайские ученые создали лингвистический корпус из 2,3 млрд неупрощенных иероглифов, что должно стать хорошим подспорьем для исследования древних текстов и лингвистики. Система работает как на уровне отдельного иероглифа, так и слова, термина и знака препинания.
В Китае и ранее предпринимались попытки создать подобные сервисы, но отличительной особенностью нынешнего проекта стала высокая безошибочность результатов. По оценкам специалистов, точность перевода отдельных упрощенных иероглифов в неупрощенные равняется 99,994 проц, для древних текстов показатель достигает 99,122 проц.