Поисковый сервис «Яндекса» для бизнеса
Yandex Data Factory, подразделение «Яндекса», созданное для решения бизнес-задач путем анализа больших данных, анонсировало сервис для поиска и мониторинга важной для бизнеса информации –«Экстракт». Сервис обучается на размеченных результатах поиска: пользователь выбирает, какие страницы ему подошли, и «Экстракт» сам находит похожие в интернете.
Как поясняют в YDF, обычный поиск «Яндекса» помогает быстро находить информацию и решать повседневные задачи: в ответ на запрос пользователь получает релевантные результаты на первой странице, а иногда прямо в поисковой строке. Однако организациям часто нужно, например, найти всю доступную информацию в определенной области: например, консалтинговую фирму могут интересовать все публикации об инвестициях китайских компаний в Австралии. Для их получения пришлось бы задавать десятки разных запросов, просматривать тысячи результатов, и все равно собрать полные данные практически невозможно. «Экстракт» решает задачу иначе: смотрит, какие страницы релевантны для пользователя, и находит в интернете все похожие на них.
Образцы релевантных страниц пользователь отмечает вручную. «Экстракт» строит на их основе поисковую модель и показывает все похожие страницы, которые нашлись в индексе «Яндекса», а затем с заданной периодичностью добавляет свежие результаты. Среди них также можно отмечать релевантные и нерелевантные: чем больше страниц размечено, тем точнее и полнее будут результаты работы сервиса.
«Экстракт» предназначен для аналитических отделов компаний и организаций. Сейчас он проходит закрытое бета-тестирование, для участия в котором нужно оставить заявку. Помимо стандартного сервиса Yandex Data Factory предлагает индивидуальные решения в области специализированного поиска.