Команда студентов из Корнельского университета (США), принимающая участие в программе Tech Challenge, разработала самообучающееся приложение, способное распознавать сарказм. Приложение-сервис, получившее название TrueRatr, является совместной разработкой Cornell Tech и Bloomberg. Сам проект делался с целью научиться автоматически определять сарказм в обзорах различных товаров.
Но использовать разработку можно и для других целей, благо, это open source. Разработчики утверждают, что научить машину определять сарказм было очень непросто. Ранее подобные попытки делались, но определять сарказм по фразам типа yeah, right, пунктуации или другим подобным признакам - не лучшее решение, пишет geektimes.ru.
После детальной дискуссии было принято решение научиться искать в тексте слова, несущие как негативное, так и позитивное значение. Все они должны находиться в пределах одной и той же фразы. Примером может быть I love getting yelled at, где I love несет позитивный контекст, а getting yelled at - негативный. Вся эта фраза с большой степенью вероятности будет помечена системой, как сарказм.
После использования такого метода точность алгоритма возросла до 71%. Это, конечно, недостаточно, но все же существенно выше, чем простое подбрасывание монетки - так выразился сам руководитель проекта. Для повышения точности алгоритма разработчики сделали его самообучающимся. И это сработало, алгоритм стал еще более точным, показатель эффективности возрос до 75%. К слову, люди определяют сарказм заметно хуже.
Читайте также: ТОП-9 воплощенных в жизнь гаджетов агента 007 (фото)
1000 гривен от государства: как получить помощь пенсионерам
Гороскоп на 26 ноября: во вторник Вселенная на вашей стороне
Индексация пенсий в 2025 году будет не для всех: кто окажется за бортом повышений
Налоговая проверяет украинцев за границей: что уже известно
В общем, пока что можно сомневаться в том, что использование TrueRatr для обнаружения обзоров с сарказмом - лучшее применение разработке. Но если есть желание, алгоритм можно использовать в собственных проектах.