Принцип работы поисковых систем
Posted on Пятница, Сентябрь 25th, 2009 at 07:57Принцип работы поисковых систем
Поисковые машины имеют 3 основные составляющие:
1.
Поисковый робот
Поисковый робот – это специальная программа (называемая также «пауком»), которая обходит сеть и собирает информацию о новых страницах, передавая ее впоследствии в базу данных (индекс).
2.
Индекс
Индекс представляет собой базу данных, которая содержит копию каждой найденной страницы. Обновление базы происходит каждый раз, когда поисковый робот находит новые страницы.
3.
Механизм ранжирования
Механизм ранжирования – это программа, которая определяет релевантность страницы (степень соответствия) поисковому запросу на основе семантического анализа документа, плотности и соответствия ключевых слов, ссылок с других Интернет-ресурсов и других параметров. От релевантности страницы зависит ее место при выводе результатов поиска.
Процесс обработки поискового запроса происходит следующим образом:
1. Поисковый запрос принимается и проверяется на наличие специфических команд и ошибок (в случае ошибок, как правило, предлагается правильный или наиболее подходящий вариант).
2. По поисковому запросу подбираются страницы из индекса и выводятся в порядке релевантности.
3. Запрашивается список текущих рекламных объявлений, удовлетворяющих поисковому запросу, и выводится в блоке рекламы.




