Как пояснили в компании, зачастую пользователи пишут запросы в свободной форме и алгоритм должен понимать, о чем именно его спрашивают, чтобы найти нужный ответ.
"Поисковый алгоритм "Королев" сравнивает семантические векторы поисковых запросов и веб-страниц целиком - а не только их заголовков. Это позволяет выйти на новый уровень понимания смысла. Представьте, что вы впервые услышали о романе Льва Толстого "Война и мир". Безусловно, вы сможете извлечь смысл из названия - например, предположить, что в книге много батальных сцен. Но чтобы узнать все хитросплетения сюжета и давать исчерпывающие ответы на вопросы о романе, вам потребуется прочитать его полностью", - говорится в сообщении компании.
Преобразование текстов веб-страниц в семантические векторы осуществляет нейросеть. Этот процесс требует значительных вычислительных мощностей, поэтому "Королев" высчитывает векторы страниц не в режиме реального времени, а заранее, на этапе индексирования. Когда человек задает запрос, алгоритм сравнивает вектор запроса с уже известными ему векторами страниц.
Алгоритм "Королев" пришел на смену запущенному в ноябре прошлого года алгоритму "Палех", в работе которого также использовались нейросети. По словам представителей компании, если в "Палехе" через смысловой анализ проходит всего 150 документов на завершающем этапе, то в "Королеве" он производится для 200 тысяч документов. Кроме того, новый алгоритм не только сравнивает текст веб-страницы с поисковым запросом, но и обращает внимание на другие запросы, по которым люди приходят на эту страницу, что позволяет установить дополнительные смысловые связи.
В сообщении также говорится, что для обучения алгоритма были использованы запросы десятков миллионов пользователей, а на странице "Королева" каждый может узнать некоторые подробности о своем взаимодействии с поисковиком за последнее время.