Поиск Яндекса с помощью машинного обучения научился предсказывать будущие запросы пользователей: теперь он предлагает полезные запросы, о которых пользователь, возможно, сам не успел подумать.
Предиктивные запросы отличаются от других возможностей поисковика тем, что они не предлагают наиболее популярные запросы, как обычные саджесты (рекомендации), а рекомендуют те запросы, по которым человек кликнет с наибольшей вероятностью. Для того чтобы узнать такие запросы, используются данные предыдущей сессии и общей истории поиска всех пользователей.
Например, если пользователь ищет, где купить сноуборд, поиск предложит «Как подобрать сноуборд по росту и весу». У разработчиков к таким рекомендациям есть три основных требования:
- Рекомендации должны быть полезны, то есть подходить по тематике и при этом действовать на шаг вперед – предлагать то, что человек сам стал бы искать.
- Масштабируемость. Разработчики стремятся увеличить число тем, по которым поисковик эффективно предсказывает запросы.
- Простота реализации.
База потенциально интересных запросов фильтруется с помощью алгоритма машинного обучения k-Nearest Neighbors (или поиска ближайших соседей). Затем система выбирает из сотни возможных вариантов топ-5 запросов, по которым пользователь кликнет с наибольшей вероятностью. Эту вероятность система узнает на основе фидбека пользователей – сейчас поиск уже запущен и собирает обратную связь для улучшения рекомендательной системы.
По словам разработчиков, это новый уровень взаимодействия поисковой системы с пользователями, поскольку так поисковик не просто исправляет опечатки и советует наиболее частые запросы, но и предлагает пользователю что-то новое.