Компания «Яндекс» объявила о запуске нового поискового алгоритма «Королев», который при помощи нейросети способен сопоставлять смысл поисковых запросов и содержимого веб-страниц, что позволяет выдавать более точные результаты в ответ на сложные запросы пользователей, пишет hitech.newsru.com.
Как пояснили в компании, зачастую пользователи пишут запросы в свободной форме и алгоритм должен понимать, о чем именно его спрашивают, чтобы найти нужный ответ.
«Поисковый алгоритм „Королев“ сравнивает семантические векторы поисковых запросов и веб-страниц целиком — а не только их заголовков. Это позволяет выйти на новый уровень понимания смысла. Представьте, что вы впервые услышали о романе Льва Толстого „Война и мир“. Безусловно, вы сможете извлечь смысл из названия — например, предположить, что в книге много батальных сцен. Но чтобы узнать все хитросплетения сюжета и давать исчерпывающие ответы на вопросы о романе, вам потребуется прочитать его полностью», — говорится в сообщении компании.
Преобразование текстов веб-страниц в семантические векторы осуществляет нейросеть. Этот процесс требует значительных вычислительных мощностей, поэтому «Королев» высчитывает векторы страниц не в режиме реального времени, а заранее, на этапе индексирования. Когда человек задает запрос, алгоритм сравнивает вектор запроса с уже известными ему векторами страниц.
Алгоритм «Королев» пришел на смену запущенному в ноябре прошлого года алгоритму «Палех», в работе которого также использовались нейросети. По словам представителей компании, если в «Палехе» через смысловой анализ проходит всего 150 документов на завершающем этапе, то в «Королеве» он производится для 200 тыс. документов. Кроме того, новый алгоритм не только сравнивает текст веб-страницы с поисковым запросом, но и обращает внимание на другие запросы, по которым люди приходят на эту страницу, что позволяет установить дополнительные смысловые связи.
В сообщении также говорится, что для обучения алгоритма были использованы запросы десятков миллионов пользователей, а на странице «Королева» каждый может узнать некоторые подробности о своем взаимодействии с поисковиком за последнее время.