Размах обсуждений, вызванных последними изменениями алгоритма ранжирования сайтов в “Яндексе” поразил даже бывалых оптимизаторов. Всю неделю не утихали споры и предположения, изрядно сдобренные нелестными отзывами в адрес разработчиков “Яндекса”. Наконец, 26 марта поисковая с
стема “Яндекс” выпустила официальный пресс-релиз, в котором сообщила о введении нового алгоритма. Что кроется за сухими строчками пресс-релиза? Мы побеседовали с техническим директором компании “Яндекс” Ильей Сегаловичем.
– Давайте для начала определимся – новый алгоритм ранжирования действительно абсолютно новый или на имеющийся алгоритм наложены новые факторы?
– Алгоритмы новые, и хотя при этом используется часть применявшихся ранее факторов, добавлено более 10 новых факторов ранжирования.
– В дискуссиях последних дней не раз звучала мысль, что ссылочного ранжирования больше не будет, или наоборот – только оно и будет…
– Поиск с использованием ссылок доказал свою эффективность еще в 1999-2001 годах, и ни одна поисковая система не может от него отказаться.
– Введение механизмов пользовательской оценки – т.е. асессоров – особо не афишировалось Яндексом, хотя оптимизаторы еще осенью отследили их активность. Их деятельность и раньше влияла на ранжирование или до сих пор шла обкатка этого механизма?
– С осени прошлого года велись активные работы по построению новых алгоритмов с использованием оценок асессоров. Эти работы продолжаются и интенсифицируются.
– А хватает ли мощностей асессорского отдела для обработки необходимого количества результатов поиска – ведь, по всей видимости, именно их дело оценить, насколько хорошо документы могут удовлетворить потребность пользователей?
– Мощность отдела асессоров уже позволила нам глубоко оценить сотни запросов. Тем не менее, пока мы только расширяем этот отдел.
– А как определяется эта потребность – по цепочкам запросов?
– Связанные запросы — один из важных источников информации, который позволяет лучше понять информационную потребность пользователя. Мы используем эти данные для анализа и построения алгоритмов, но не при выполнении запросов.
– Можно ли провести такое сравнение – асессоры обучают алгоритм поиска также, как пользователи обучают антиспамовые фильтры?
– Да, можно. Более того, Вы угадали, в экспериментах мы использовали один и тот же алгоритм для подбора коэффициентов и в поиске, и в “Спамообороне”.
– Раз зашла речь о спаме – насколько связаны новые технологии в поиске – скажем, упомянутое в пресс-релизе распознавание вспомогательной, технической и рекламной информации с разработками Яндекса в области борьбы со спамом и, в частности, новой версией “Спамообороны”, недавно запущенной?
– Поисковый и почтовый спам совершенно различны по технической природе. Тем не менее, в обоих случаях стоит задача отличить нечто “рукотворное” от автоматически созданного продукта.
– Многие поисковые системы давно пытались так или иначе использовать человека для оценки релевантности результатов поиска – и понижая некликабельные позиции, я помню разработку NBCi, которые подсчитывали интервал между кликами одного и того же юзера на разных позициях. Яндекс тоже фиксирует клики пользователей и довольно давно, но вместе с тем и работают асессоры. Подсчет кликов не удовлетворил или он изначально не для этого делался?
– Анализ кликов используется для разных целей, в том числе для интегральной оценки качества поиска. Однако, непосредственно для настройки качества поиска эти данные не годятся, ведь пользователи делают выбор только по цитатам из документов и адресам страниц.
Асессоры же работают по заданной методике, мы выработали критерии, по которым должно измеряться качество страницы, и достоверность результатов их работы легко проверяется.
– Методика, о которой идет речь – она останется закрытой или Яндекс планирует обнародовать ее?
– Яндекс давно участвует в научной деятельности в области информационного поиска, является соучредителем конференции “Диалог”, соорганизатором семинара “РОМИП”. Тем не менее, мы не собираемся опубликовать эту методику, в том числе потому что она тесно связана с поисковыми алгоритмами, которые мы обязаны хранить в тайне.
– А не может ли получиться так – качество страниц будет очень высоким по Вашей методике, а пользователи будут недовольны выдачей?
– Такая ситуация маловероятна. Как я говорил раньше, оценки асессоров — важный, но не единственный источник информации о качестве поиска. Мы используем для дополнительного контроля как автоматические, так и ручные методы оценки.
– Поиск в регионе – вещь принципиально новая. Каким образом Яндекс будет определять регион сайта или отдельной страницы?
– При реализации функция поиска в регионе мы предпочли точность полноте. То есть сейчас после уточнения региона поиск идет по страницам сайтов, которые зарегистрированы в каталоге Яндекса и у которых регион соответствует региону пользователя.
– Т.е. пока не планируется анализировать окружение ключевых слов на предмет наличия там указаний на регион?
– Мы не обнародуем наши планы. Если мы сделаем это, Вы обязательно узнаете через пресс-релиз.
www.searchengines.ru