Meta выложила в открытый доступ модель ИИ, которая переводит тексты с 200 языков
Конгломерат социальных сетей Meta создал единую модель ИИ, способную переводить на 200 различных языков, в том числе многие из которых не поддерживаются текущими коммерческими инструментами. Компания открывает исходный код проекта в надежде, что другие будут опираться на его работу.
Модель искусственного интеллекта является частью амбициозного научно-исследовательского проекта Meta по созданию так называемого «универсального переводчика речи», который компания считает важным для роста своих многочисленных платформ — от Facebook и Instagram до развивающихся областей, таких как VR и AR. Машинный перевод не только позволяет Meta лучше понимать своих пользователей (и, таким образом, улучшать рекламные системы, которые приносят 97% дохода компании), но также может стать основой отличных приложений для будущих проектов, таких как очки дополненной реальности.
Эксперты по машинному переводу назвали последнее исследование Meta амбициозным и скрупулезным, но отметили, что качество некоторых переводов, вероятно, будет намного ниже, чем у языков с лучшей поддержкой, таких как итальянский или немецкий.
В то время как большинство моделей машинного перевода работают только с несколькими языками, модель Meta инкапсулирует все: это единая система, способная переводить более чем в 40 000 различных направлениях между 200 языками. Но Meta также заинтересована во включении в модель «языков с низким уровнем ресурсов» — с менее, чем 1 миллионом общедоступных переведенных пар предложений. К ним относятся многие африканские и индийские языки, которые обычно не поддерживаются коммерческими инструментами машинного перевода.
Справедливо заметить, что те примеры перевода, которые мы видим в интерфейсе Facebook, как-то не обнадеживают в плане качества. Если уж такие распространенные пары, как французский-русский или чешский-украинский, заставляют пользователей ломать голову, что хотел написать автор в оригинале, то как разобрать результат работы модели над сото, например?