Міжнародна група лінгвістів опублікувала кілька варіантів текстів Нового Заповіту, який використовують для навчання алгоритмів машинного перекладу. Це в подальшому дозволить зберегти ряд зникаючих мов.
Результати дослідження опублікували на сайті Cornell University Library. За підрахунками вчених в світі існує майже сім тисяч мов. Але 95% населення планети використовує лише 100 з них. Носіями приблизно третини живих мов виступає менше однієї тисячі осіб. У найближче сторіччя деякі діалекти повністю зникнуть.
Дослідники припустили, що їх зберегти допоможуть алгоритми машинного перекладу. Але для освоєння цієї технології системам потрібний великий обсяг текстів. Автори дослідження створили корпус зі 1169 перекладів Нового Заповіту, який є найбільш поширеним текстом в світі.
Кожен переклад дасть можливість реалізувати основні граматичні категорії кожної мови. Навчання проводитиметься за допомогою складання маркерів лінгвістичних функцій. Карта мов дозволить з'ясувати, які з них використовують схожу граматику.
Банки по-новому відслідковуватимуть перекази: за що можуть заблокувати рахунок
Треба лиш пережити цю зиму: українців обнадіяли щодо морозів і холодів
Лікарняний у 2026 році: скільки днів можна взяти та як оформити
Пенсії можуть зрости утричі: у Раді хочуть поетапно збільшувати мінімальні виплати
До недоліків техніки вчені віднесли низьку чутливість: так, вона не розрахована на розрізнення словоформ. Потенційно, крім навчання автоматичних перекладачів, вона в той же час може використовуватися для вивчення еволюції мов.
Нагадаємо, раніше портал "Знай.ua" повідомляв, дивовижна знахідка археологів змусить науковий світ переглянути дату зародження життя на планеті Земля.