Принципы работы поисковых систем. О сложном простыми словами

Принципы работы поисковых систем. О сложном простыми словамиСтатья простым языком описывает алгоритм работы "Яндекса", дает представление о релевантности и ранжировании, о факторах, влияющих на порядковый номер сайта в выдаче, порядке поиска, обработки и накопления информации в базах поисковой системы. Работа поисковых систем для многих по эти поры является тайной за семидесятью печатями. В число неосведомленных людей порой входят не только рядовые пользователи, но и начинающие SEO-специалисты. Между тем, в общих чертах процессы, протекающие в поисковых системах с момента размещения новой информации в Сети до ее появления в результатах выдачи, может понять каждый. Итак, как работает "поисковик"?

Сканирование и классификация

Поиском новой информации в интернете занимается специальный виртуальный робот - паук. Данная программа беспрерывно путешествует по Сети, переходит по всем найденным ссылкам, сверяет найденную информацию с той, которая уже имеется в поисковой системе. При обнаружении новых сайтов, уникального контента, обновлений на известных страницах паук информирует об этом систему сохранения информации.

Результаты выдачи поисковых систем основываются не на всем, что имеется в Сети. Для ответов на запросы пользователей используется только информация, содержащаяся в базе данных поисковика. Поэтому после обнаружения нового сайта или контента данные о нем сохраняются в базу. После этого проводится определение ее релевантности и ранжирование.

Понятие о релевантности и порядок сортировки информации в выдаче по запросу

Сохраненная в базу данных поисковика информация проходит определенную обработку и классификацию. Так, поисковая система распределяет найденные сайты по конкретным поисковым запросам (релевантность по какому-либо запросу). Например, статья, содержащая фразу "Как построить дом из дерева…" будет релевантна запросу "построить дом". Однако и это еще не все.

Далее информация проходит ранжирование. Этот процесс представляет собой определение позиции сайта в выдаче поисковика по релевантным запросам. Собственно, работа SEO-оптимизаторов направлена как раз на то, чтобы поднять позицию ресурса при ранжировании. На место в выдаче поисковика влияют следующие факторы:

Читайте также  Как обезопасить сайт от обновления алгоритмов Google

1. Внутренние факторы. Сюда входит оформление ресурса, степень его наполненности, наличие определенной структуры и т.д. Именно эти показатели могут корректироваться вебмастером целенаправленно.
2. Внешние факторы. Наибольшее значение здесь имеет мнение других ресурсов о данном сайте. Учитывается количество сторонних ссылок. Шансы получить первые места в выдаче поисковика увеличиваются, если ссылки на сайт присутствуют на больших и авторитетных ресурсах.
3. Поведенческие факторы. В данном случае поисковая система отслеживает активность пользователей сайта, обращает внимание на количество лайков, репостов, просмотров видео, время пребывания пользователей на странице.
Всего при ранжировании поисковые системы учитывают огромное количество факторов (более семисот). Однако все они неизвестны никому, кроме создателей поисковика. Подобные данные держатся в тайне. Это необходимо, чтобы предотвратить попадание сайта в ТОП-10 выдачи нечестными путями.

Апдейт Яндекса

Некоторые крупные поисковые системы стараются добавлять новую информацию непрерывно. Российский "Яндекс" придерживается другого алгоритма действий. Здесь добавленная и ранжированная информация накапливается в отдельном хранилище. Ее появление в базе данных, предназначенной для работы непосредственно с поисковыми запросами, происходит примерно один раз в неделю. Это явление называют апдейтом поисковой системы.

Апдейт "Яндекса" происходит чаще ночью, в моменты максимально низкой нагрузки на серверы поисковика. После этого информация появляется в поиске в порядке, определенном в процессе ранжирования. Стоит заметить, что новая информация с сайтов, уже имеющихся в базе поисковой системы, попадает в выдачу значительно быстрее, чем данные с новых ресурсов, только что появившихся в Сети и еще не проиндексированных (не занесенных в базу) поисковыми системами.

Поисковым роботом для доступа на разные ресурсы можно руководить при помощи файла robots.txt  А карта блога  sitemap.xml  также оказывает помощь роботу в том случае, если навигация по сайту для него затруднена.

Читайте также  Язык поисковых систем

Полезная ссылка: О поисковом роботе

https://ru.wikipedia.org/wiki/Поисковый_робот

Здесь можно прочесть  Как работают поисковые системы

http://cache-default05g.cdn.yandex.net/download.yandex.ru/company/iworld-3.pdf

Надежда Интернет для начинающих

Возможно Вас другие статьи заинтересуют:

● Как обезопасить сайт от обновления алгоритмов Google
Последние обновления поисковых фильтров заставили серьезно понервничать многих вебмастеров. Сначала вышел фильтр Panda, а когда все немного приноровились и научились работать ...
● Мощный плагин для WordPress по улучшению сайта
Идеалов для WordPress не существует. Но можно приблизить все настройки сайта на ВордПресс к нему.  Плагин создали практикующие вебмастера и ...
● Каталог сайтов DMOZ — как попасть
Многие вебмастера знают о том, что для сайтов существуют специальные каталоги, регистрация в которых в той или иной степени помогает ...
● Фильтры Яндекса и их влияние на сайт
Ваша площадка теряет позиции, снизился трафик, новые страницы никак не могут добавиться в индекс? Причина проста – ваш сайт попал ...
● Релевантность. Значение этого параметра в продвижении сайта
Для того чтобы сделать объективный вывод о том, какую роль релевантность играет в продвижении сайтов, необходимо разобраться, что собой представляет ...

Комментарии 14

  • Все настолько непонятно для меня с роботами, что не знаю- как им и угождать. Многие теплые места в выдаче уже давно заняты сайтами-монополистами, их трудно бывает подвинуть, прочно они там сидят.

    • Да Людмила, сайты монополисты трудно подвинуть, у них много денег на рекламу и статьи им пишут, как я полагаю, опытные копирайтеры. Поэтому двигаюсь своим путём.

  • Был у меня плачевный опыт — АГС. Пришлось сайт переносить на другое доменное имя и учиться угождать роботам, иначе никак.

    • У меня тоже Наталочка был такой опыт: забросила сайт, потому что не знала, как выводить из под АГС. Попозже пришел опыт от школы СтарАп. Но я не жалею о том, что забросила сайт. По настоящему меня научила школа СтарАп.

  • Боже ж мой, как все сложно. Учиться, учиться и учиться еще всему.

    • Да Светланочка: век живи, век учись и все равно всего не выучишь. Ну хотя бы что — то для себя мы можем усвоить, хотя и не в абсолютной форме.

  • Да уж, от роботов зависит, попадет статья в выдачу или будет лежать на блоге. Мы тут стараемся, пишем, но у них на все свой взгляд. Мой блог больше Яндекс выдает, а чем руководствуется при выдаче, трудно сказать.

    • Мне Ирина многое до сих пор непонятно, но одну вещь я усвоила, кое что применила. В обратную связь мне уже прислали предложения: по поводу установки рекламы на моем блоге и деньги нормальные предложили, но я пока не буду этого делать. Не во всем еще разобралась, буду своим путем идти, там время покажет, как и что.

  • Сил на них уже нет и так и этак им угодить пытаемся..

    • Иннокентий, согласна с Вами. Непоняток много еще, кое что усвоила, кое что подсказали и вот результат не заставил себя ждать. Значит верно иду, хотя совсем потихоньку.

  • Да. Ведем свой сайты и блоги, а сами думаем, как бы угодить поисковым роботам)

    • Если честно Дмитрий, я раньше как — то старалась понравиться нашим поисковым, а потом многие идеи возникли и я начала их претворять на блоге. Ну вот и результат прилетел. А работы на блоге много.

  • Ох уж эти поисковые роботы! Все мы в их зависимости и стараемся им понравиться. А понравиться им очень сложно и для этого надо только пахать и пахать!

    • Не говори Тая про поисковых: я раньше старалась, стремилась, а попозже, когда начала в кое — что вникать, сделала анализ сама. Многое переделала, оно так незаметно на блоге постороннему человеку, но я знаю, где и что я изменила, добавила. Буду делиться своим опытом.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *