Сервис пока находится в режиме бета-тестирования. Яндекс будет повышать качество и скорость перевода, а также добавлять другие языковые пары, говорят в компании.
Система машинного перевода анализирует миллионы текстов — переводов друг друга на разные языки — и создает специальные словари. При переводе система выбирает из словарей наиболее вероятные варианты, учитывая контекст.
Данный, статистический, метод машинного перевода основывается не на правилах языка (системе эти правила даже не известны), а на статистике. Чтобы "выучить" язык, система сравнивает сотни тысяч параллельных текстов — содержащих одну и ту же информацию, но на разных языках.
Это могут быть, например, большие тексты с разноязычных версий сайтов организаций. Изначально система находит параллельные тексты по адресам документов.
Для каждого изученного текста система строит список уникальных признаков. Это могут быть редко используемые слова, числа, специальные знаки, находящиеся в тексте в определённой последовательности. Когда система набирает достаточное количество текстов с признаками, она начинает искать параллельные тексты ещё и с их помощью — сравнивая признаки новых текстов и уже изученных.
Чтобы переводчик соответствовал современным стандартам качества, система должна изучить сотни миллионов фраз на разных языках.