|
Страница 1 из 5 Нередко для того, чтобы отыскать нужный сайт, пользователи обращаются к каталогам - например, Rambler Top100. Однако каталог - это, конечно, хорошо, но далеко не всегда пользователя интересует какая-то широкая тематика - кино, музыка и так далее. Значительно чаще пользователь хочет найти в Интернете что-то более конкретное: информацию о творчестве Герберта фон Караяна; личный сайт писателя, актера, музыканта, режиссера; спецификацию клапана типа Г57, жилищный кодекс РФ и так далее. Что делать в этом случае, ведь в Rambler нет отдельного раздела каталога с сайтами, посвященными творчеству Герберта фон Караяна или спецификации клапанов типа Г57? Вот как раз в подобных случаях и нужно пользоваться поисковыми системами, в которых, как гласит рекламный слоган самой популярной российской поисковой системы Яndex, "Найдется все!". Но прежде чем мы начнем работать с поисковой системой, сначала необходимо хотя бы в общих чертах понять, как именно она работает, точнее, что именно она ищет и в какой последовательности выводит результаты поиска. Потому что поиск в Интернете, при всей его кажущейся простоте, - это своего рода искусство. Чем лучше вы будете понимать, как составляются поисковые запросы и как на них реагируют поисковые системы, тем быстрее вы будете находить то, что вам нужно. С другой стороны, если о поиске в Интернете не знать ничего, то можно сутками перелопачивать тонны сайтов, так и не найдя то, что вас интересует.
Как работает поисковая системаМногие пользователи почему-то считают, что в ответ на их вопрос поисковая система начинает быстро-быстро шерстить весь Интернет, после чего выдает список страниц, где отыскалось что-то похожее на строку поиска, введенную пользователем. Разумеется, в действительности все происходит совершенно не так, потому что если бы поисковая система при каждом запросе шерстила весь Интернет (или даже его маленькую часть), ответа приходилось бы дожидаться годами. На самом деле почти каждая поисковая система (скажем так - классическая поисковая система) состоит из трех основных компонентов: веб-паук (web spider); индексатор; алгоритм поиска и оценки результатов.
Веб-паук, несмотря на всю экзотичность подобного названия, - это всего-навсего специальная программа, которая запускается на компьютере (компьютерах), подключенном к Интернету, и ее основная задача - шерстить весь этот Интернет (точнее, интернетовские странички) во всех возможных направлениях. Ведь странички, как мы говорили, состоят из гиперссылок, так вот паук носится как угорелый по гиперссылкам "паутины" сайтов и скачивает полученные таким образом странички для второй компоненты - индексной базы. Индексатор - это обработчик скачанных веб-пауком страниц. Он извлекает оттуда все слова и складывает их в поисковую базу (индексную базу). При этом индексатор записывает, где именно было найдено то или иное слово, и эта информация потом используется в поиске. Алгоритм поиска - это главное ноу-хау любой поисковой системы. От алгоритма зависит эффективность полученного результата - то есть насколько быстро и точно пользователь найдет то, что его интересует. Внимание! Таким образом, когда пользователь вводит свой запрос, поисковая система ищет ответ в своей индексной базе и выводит результаты в соответствии со своим алгоритмом поиска.
Для хорошей работы поисковой системы важны все три компоненты. Причем каждая из них на самом деле весьма сложна, и ее работа подчиняется огромному количеству всевозможных хитрых правил, которые к тому же постоянно корректируются. Поисковик должен иметь и шустрого паука, и мощную индексную базу, и эффективный алгоритм поиска - только тогда вы будете получать действительно полезные результаты.
<< В начало < Предыдущая 1 2 3 4 5 Следующая > В конец >> |