Міжнародна група лінгвістів опублікувала кілька варіантів текстів Нового Заповіту, який використовують для навчання алгоритмів машинного перекладу. Це в подальшому дозволить зберегти ряд зникаючих мов.
Результати дослідження опублікували на сайті Cornell University Library. За підрахунками вчених в світі існує майже сім тисяч мов. Але 95% населення планети використовує лише 100 з них. Носіями приблизно третини живих мов виступає менше однієї тисячі осіб. У найближче сторіччя деякі діалекти повністю зникнуть.
Дослідники припустили, що їх зберегти допоможуть алгоритми машинного перекладу. Але для освоєння цієї технології системам потрібний великий обсяг текстів. Автори дослідження створили корпус зі 1169 перекладів Нового Заповіту, який є найбільш поширеним текстом в світі.
Кожен переклад дасть можливість реалізувати основні граматичні категорії кожної мови. Навчання проводитиметься за допомогою складання маркерів лінгвістичних функцій. Карта мов дозволить з'ясувати, які з них використовують схожу граматику.
Нові правила бронювання від мобілізації: що зміниться з 1 грудня
Масштабне березневе підвищення пенсій: 2300 отримають не всі
Є умова, вводять ліміт на 30 днів: що буде з тарифом на світло з 1 грудня
Долари з "заначки" можуть розчарувати: почали діяти нові правила обміну валюти
До недоліків техніки вчені віднесли низьку чутливість: так, вона не розрахована на розрізнення словоформ. Потенційно, крім навчання автоматичних перекладачів, вона в той же час може використовуватися для вивчення еволюції мов.
Нагадаємо, раніше портал "Знай.ua" повідомляв, дивовижна знахідка археологів змусить науковий світ переглянути дату зародження життя на планеті Земля.