Міжнародна група лінгвістів опублікувала кілька варіантів текстів Нового Заповіту, який використовують для навчання алгоритмів машинного перекладу. Це в подальшому дозволить зберегти ряд зникаючих мов.
Результати дослідження опублікували на сайті Cornell University Library. За підрахунками вчених в світі існує майже сім тисяч мов. Але 95% населення планети використовує лише 100 з них. Носіями приблизно третини живих мов виступає менше однієї тисячі осіб. У найближче сторіччя деякі діалекти повністю зникнуть.
Дослідники припустили, що їх зберегти допоможуть алгоритми машинного перекладу. Але для освоєння цієї технології системам потрібний великий обсяг текстів. Автори дослідження створили корпус зі 1169 перекладів Нового Заповіту, який є найбільш поширеним текстом в світі.
Кожен переклад дасть можливість реалізувати основні граматичні категорії кожної мови. Навчання проводитиметься за допомогою складання маркерів лінгвістичних функцій. Карта мов дозволить з'ясувати, які з них використовують схожу граматику.
Виплатять майже 2 400 гривень: які 5 доплат можуть отримати пенсіонери
Один клік і грошей немає: ПриватБанк попередив про нову загрозу
Пенсіонерам подвоять доплати: хто отримає більше грошей
Українці, у вас є Приват24? Банк терміново звернувся до клієнтів із заявою, перевіряйте у себе
До недоліків техніки вчені віднесли низьку чутливість: так, вона не розрахована на розрізнення словоформ. Потенційно, крім навчання автоматичних перекладачів, вона в той же час може використовуватися для вивчення еволюції мов.
Нагадаємо, раніше портал "Знай.ua" повідомляв, дивовижна знахідка археологів змусить науковий світ переглянути дату зародження життя на планеті Земля.