Международная группа лингвистов опубликовала несколько вариантов текстов Нового Завета, который используют для обучения алгоритмов машинного перевода. Это в дальнейшем позволит сохранить ряд исчезающих языков.

Результаты исследования опубликовали на сайте Cornell University Library. По подсчетам ученых в мире существует почти семь тысяч языков. Но 95% населения планеты использует лишь 100 из них. Носителями примерно трети живых языков выступают менее одной тысячи человек. В ближайшее столетие некоторые диалекты полностью исчезнут.

Исследователи предположили, что их сохранить помогут алгоритмы машинного перевода. Но для освоения этой технологии системам потребуется большой объем текстов. Авторы исследования создали корпус из 1169 переводов Нового Завета, являющийся наиболее распространенным текстом в мире.

Каждый перевод даст возможность реализовать основные грамматические категории каждого языка. Обучение будет проводиться с помощью составления маркеров лингвистических функций. Карта языков позволит выяснить, какие из них используют схожую грамматику.

Популярные статьи сейчас

Новые правила бронирования от мобилизации: что изменится с 1 декабря

Пенсионерам "навесят" новое финансовое бремя: никаких льгот не ждите

Мобилизацию уравняли для всех: украинцам объявили вердикт по экономическому бронированию

Доллары с "заначки" могут разочаровать: начали действовать новые правила обмена валюты

Показать еще

К недостаткам техники ученые отнесли низкую чувствительность: так, она не рассчитана на различение словоформ. Потенциально, помимо обучения автоматических переводчиков, она в то же время может использоваться для изучения эволюции языков.

Напомним, ранее портал "Знай.ua" сообщал, удивительная находка археологов заставит научный мир пересмотреть дату зарождения жизни на планете Земля.