В Справочнике, базе данных об организациях, указаны адреса, часы работы, контактные телефоны и так далее. Каждый день туда поступает по несколько тысяч правок, нуждающихся в модерации. Разработчики Яндекса создали Автомодератор, ускоривший проверку правок — теперь она занимает не несколько суток, а несколько часов или даже минут.
Автоматический классификатор правок, Автомодератор, основан на технологии машинного обучения CatBoost и обучен на примерах хороших и плохих правок. Справочник не может обойтись без модерации, потому что при обновлении данных нередко появляются ошибки (конкуренты вводят неверные данные или вандалы добавляют нецензурную лексику в описания компаний).
При проверке данных Автомодератор учитывает историю правок и вносит изменения. В спорных ситуациях машина может проверить сайт организации или позвонить за уточнениями, а в некоторых случаях отправляет на перепроверку человеку. В этом случае помочь могут операторы колл-центра или толокеры (пользователи Яндекс.Толоки) сверяют данные «вручную».
Автомодератор работает в режиме реального времени и в некоторых случаях вносит изменения за несколько минут.