Table of Contents
Алгоритм ранжирования сайтов в Яндексе постоянно меняется: добавляется новый функционал, устраняются баги, обновляются ограничения и фильтры, выдача подгоняется, чтобы соответствовать статусу качественной и релевантной запросу. Очень долгое время учёт алгоритмов ранжирования вёлся лишь внутри компании (скорей всего внутри одного отдела) и когда его резко обновляли, пользователи и вебмастера негодовали: “что это было?”.
С июля 2007 года сотрудники Яндекса начали анонсировать введение новых алгоритмов, но долгое время они оставались безымянными, а также нельзя было увидеть changelog (списка изменений). Оптимизаторам приходилось самим ставить эксперименты и тестировать выдачу, чтобы узнать, что именно поменял Яндекс в своём алгоритме. Это, конечно же, имело и свои плюсы, так как многие оптимизаторы-экспериментаторы получали доверие от других, выступая на конференциях и публикуя статьи на сайтах о наблюдениях в работе новых алгоритмов Яндекса, а seo-компании за счёт этих людей получали конкурентное преимущество.
Так продолжалось до начала 2008 года, когда Яндекс впервые упомянул название алгоритма 8 SP1 и пообещал после этого называть их именами городов. Пройдёмся по этим городам, чтобы немного вспомнить развитие алгоритма ранжирования…
Магадан
В мае 2008 г. на свет появился алгоритм под названием “Магадан”, в котором:
– вдвое увеличено количество факторов ранжирования;
– добавлены классификаторы контента и ссылок;
– улучшен геоклассификатор;
– улучшена скорость поиска по запросам, по которым находится большое число документов;
– смягчена фильтрация отбора документов для ранжирования увеличением допустимого расстояния между словами запроса в документе;
– производится обработка аббревиатур, перевода и транслитерации;
В поиске, кроме слов из текста страницы, участвуют перевод и транслитерация частей URL. Благодаря этому поиск понимает, что “mail” — это “почта”, а “bmw” — это “бмв”,
– улучшена обработка многословных запросов;
– осуществляется поиск текстов с дореволюционной орфографией;
Скажем, по запросу [кафедра Ветхого завета] найдется “каѳедра Ветхаго Завѣта”, и наоборот. Если необходимо найти только слова со старой орфографией, можно ограничить поиск точной формой, взяв слова в кавычки: [“Бѣлый, блѣдный, бѣдный бѣсъ”]. При этом поиск старается отличить такие слова от украинских. Например, по запросу [мiнiстр] найдется только украинское слово “мiнiстр” и не найдется русское “министр”. В то же время, когда нужны старые русские слова с “i”, например, по запросу [мiр], находится и русское слово “мир”.
– усовершенствован колдунщик;
Яндекс старается дать ответ на запрос, сократив время и усилия пользователей. Спрашиваете “погода”? Отвечаем: “Москва, +12 °C, дождь”, если вы живете не в Москве, погода будет показана для вашего города. Спрашиваете “Елена Колмановская”? Отвечаем: “Елена Колмановская — Яндекс, главный редактор”. И ссылка на пресс-портрет, составленный по материалам СМИ. Мы называем такие подсказки “колдунщиками”, потому что от них иногда создается впечатление, что поисковая система понимает всё, что вы хотели, и даже больше. 🙂
В июле 2008 появляется вторая версия Магадана, в которой добавлены ещё несколько факторов ранжирования (например, учитывающие уникальность контента, его принадлежность к порнографическому и др.) и пофикшены некоторы баги первой версии.
Находка
В сентябре 2008 г. Яндекс запускает “Находку”, где:
– выросло качество ранжирования по запросам со стоп-словами;
– разработан новый подход к машинному обучению;
– заметно расширены словари Яндекса;
Например, в нем появились сочетания слов, которые в раздельном написании означают то же самое, что и в “склеенном” виде (теперь по запросу [авто ваз] найдутся страницы и со словом “автоваз”).
Оптимизаторы замечают, что старые домены работают лучше новых, поэтому, возрастает спрос на старые домены. Также в этот период Яндекс строго относится к сайтам, которые меняют содержимое родительского окна, осуществляя редирект на посторонние ресурсы.
Арзамас (Анадырь)
В апреле 2009 г. Яндексом выложен следующий алгоритм под названием “Арзамас”, в котором:
– Яндекс научился лучше понимать русский язык, разрешая неоднозначности слов в запросах;
Если вы спросили [реконструкция Маяковской], мы покажем также страницу со словами [станция Маяковская открылась после реконструкции]. Но русский язык — тонкий, сложный и неоднозначный. Тем, кто ищет [фото львов], могут быть нужны как фотографии животных, так и фотографии города Львова. Человек может уточнить свое высказывание, добавив к нему одно или несколько слов: [фото африканских львов] или [фото город львов]. Теперь эти уточнения наш поиск научился понимать.
– учитывается регион пользователя, результаты поиска по одному и тому же запросу в разных регионах стали разными, всего выделено 19 крупных регионов;
– сайтам присваивается регион, который зависит от ip-адреса хостинга, контактных данных на странице или настроек в Яндекс.Каталоге;
– запросы поделились на геозависимые и геонезависимые, вводятся региональные формулы ранжирования;
– в подсказке об опечатках учитывается настройка языка браузера при определении языка запроса (в сложных случаях);
– введены жесткие фильтры для страниц с попандер-баннерами, а также кликандер и бадиклик (clickunder и bodyclick);
– улучшена формула по многословным запросам;
Снежинск
Ноябрь 2009 г. ознаменован выходом в свет алгоритма под названием “Снежинск”, где:
– введены дополнительные параметры ранжирования (нескольких тысяч поисковых параметров для одного документа);
– внедрение дополнительных региональных факторов;
– запуск самообучающейся системы MatrixNet,
– замечено плохое влияние простыней,
– стал лучше поиск оригиналов (первоисточников) контента;
– появились фильтры АГС;
Конаково
Алгоритм “Конаково” появился в декабре 2009 г., как усовершенствование версии “Снежинск”. В нём было улучшено лишь локальное ранжирование. Теперь ранжирование сайтов различно не только в 19 крупных регионах, но и в 1250 городах по всей России. В этот период в Яндексе также появился новый язык запросов.
Обнинск
Алгоритм “Обнинск” вышел в свет в сентябре 2010 г., в нём:
– улучшено ранжирование по гео-независимым запросам (таких в потоке до 70 процентов) пользователей из России;
– объём формулы ранжирования составил 280 Мбайт;
– ограничено влияние искусственных ссылок на ранжирование;
За последний месяц был произведен ряд изменений в поисковом алгоритме, чтобы существенно ограничить влияние SEO-ссылок на ранжирование. В первую очередь это относится к SEO-ссылкам с сайтов, содержащих некачественный контент, и к недавно появившимся SEO-ссылкам.
– расширился словарь транслитерации и улучшен ответ на запросы, заданные латиницей;
– улучшено определение авторства текста;
В этот же период обновился интерфейс просмотра сохраненных копий страниц, в частности, теперь можно видеть дату кэша документа.
Краснодар
Последняя смена алгоритма произошла в декабре 2010 г.. Для нового алгоритма Яндекса под названием Краснодар разработана специальная технология Спектр.
– Яндекс классифицирует запросы, выделяя из них объекты (имена, модели авто и др) и присваивая запросам категорию (товары, лекарства, поэты и др.);
– дополнительные слова из спектра запроса также вносят вклад в ранжирование;
– для улучшения качества выдачи учитываются некоторые поведенческие факторы;
– обновлено ранжирование по геозависимым запросам;
Также за этот период Яндекс проиндексировал соц.сеть вконтакте и ввёл расширенные сниппеты для многих типов организаций.
Яндекс на этом не останавливается, а работает и поныне, совершенствуя свои алгоритмы и улучшая качество выдачи.