«Как быстро найти нужный ресурс в Интернете?» - вопрос, которым очень часто задаются пользователи, пытаясь найти нужную ссылку среди сотен, а то и тысяч, любезно предоставленных поисковой системой. Нужно всего лишь научиться пользоваться этой поисковой системой правильно. Ведь что такое поисковая система? Это всего лишь алгоритм действий в соответствии с определенной логикой. Поняв эту логику, вы можете сэкономить минуты, а то и часы при поиске нужной вам информации.
Как это работает?
Многие начинающие пользователи наивно полагают, что после того, как они ввели свой запрос, поисковая система начинает каким-то непостижимым образом просматривать все сайты во всемирной паутине в поиске тех страничек, где встречаются слова, написанные в запросе, и выдает список найденных сайтов пользователю. В действительности все выглядит не так. Если бы это было правдой, то результата поиска пришлось бы ждать больше года – ибо процесс этот был бы крайне ресурсоемким и оттого медленным.
В действительности же практически любая поисковая система (в упрощенном виде) состоит из трех основных частей:
1) веб-паук (web spider)
2) индексатор
3) алгоритм поиска и оценки результатов
Веб-паук, несмотря на свое грозное название, является вполне мирной программой, которая запускается на компьютере (или нескольких компьютерах), подключенном ко всемирной сети, и основная задача которой – просматривать все интернет-страницы по всем возможным направлениям. Все эти страницы, как известно, описываются гиперссылками, и по этим самым ссылкам в Интернете и носится неугомонный веб-паук, скачивая эти самые Интернет-страницы, которые нужны для работы второго элемента поисковой системы – индексной базы.
Индексатор – это модуль обработки страниц, скачанных веб-пауком. Он извлекает из этих страниц все слова и записывает их в индексную базу (базу данных для поиска). При этом индексатор также указывает, где конкретно было встречено то или иное слово, и эта информация тоже используется впоследствии в процессе поиска.
Алгоритм поиска – это, наверное, главная и самая сложная часть любой системы поиска. От алгоритма поиска зависит эффективность всей системы – то, насколько быстро пользователь получит результат и насколько этот самый результат будет соответствовать требованиям пользователя.
То есть, когда пользователь вводит свой запрос, поисковая система ищет страницы, соответствующие этому запросу, в своей собственной индексной базе и выводит результаты в соответствии со своим алгоритмом поиска.
Для того, чтобы поисковая система обеспечивала требуемую эффективность поиска, важны все три составляющие. Каждая из них имеет довольно сложное внутреннее устройство, и работа каждого элемента подчинена целому списку всевозможных правил, причем эти правила постоянно претерпевают изменения.
Нормальная поисковая система должна иметь и быстрого веб-паука, и мощную индексную базу, и алгоритм поиска, обладающий высокой эффективностью – при соблюдении всех этих условий вы получите качественную поисковую систему, выдающую действительно полезные результаты.
Релевантность поиска – что это?
Довольно часто при обсуждении поисковых систем специалисты употребляют умное слово «релевантность». «Фиговая система, у нее поиск нерелевантный» - говорят об одном поисковике, «Отличный результат, релевантность на уровне» - могут сказать о другом. Из этих разговоров можно сделать вывод, что релевантность – это что-то хорошее, а ее отсутствие – это плохо для поисковой системы. И это правильно.
Релевантность - это степень соответствия документа запросу.
Что мы подразумеваем под «степенью соответствия»? Рассмотрим простой пример. Предположим, что вы меломан и вам хочется найти в сети что-нибудь новенькое из музыки в формате mp3. Покупать диски не хочется, потому что дорого, далеко или по какой-то еще причине – и вы принимаете решение поискать музыку в Интернете. Конечно, многие слышали, что это нарушение авторских прав и т.д., но это всего лишь пример, законность подобного действа обсуждать не будем.
Для начала вам требуется найти сайт, откуда можно было бы скачать музыку. Для этого вы заходите на поисковую систему и вводите слово для поиска «mp3». Поисковая система сверяется со своей индексной базой и находит там ссылки примерно на 20 013 страниц, где нужное слово встречается 128 834 636 раз. Причем это сочетание букв и цифры встречается не только на сайтах с музыкой, но и на страницах Интернет-магазинов, предлагающих нам широкий выбор mp3-плееров, и на блог какой-нибудь девочки-припевочки, где может быть написано что-то вроде: «папа обещал мне подарить новый mp3-плеер, обошли целую кучу магазинов, но все, что там есть, совершенно не подходит к моим сережкам и сумочке, а менять из-за плеера свой стиль я не собираюсь».
Какую ссылку нам хотелось получить – на каталог музыкальных файлов, на Интернет-магазин или на дневник девочки-припевочки, где тоже употребляется «слово» «mp3»? Конечно же, на каталог файлов! Вот именно это и называется релевантность, то есть степень соответствия полученного результата вашему запросу.
Каким же таким волшебным способом поисковая система может определить эту релевантность, то есть, какие именно страницы наиболее соответствуют требованиям пользователя? Именно в этом и заключается главный секрет разных поисковиков, однако общий принцип у них довольно схожий, и анализ результатов производится по следующему принципу:
1. Проверяется, сколько раз заданное слово (словосочетание) встречается на отобранных страничках.
Само собой, чем больше, тем лучше, потому как увеличивается вероятность того, что эти страницы посвящены именно данной тематике.
2. Проверяется расстояние между словами, если введена целая фраза.
То есть если пользователь ищет «Александр Сергеевич Пушкин», то страничка, на которой встречается «Александр Сергеевич Пушкин родился», будет более релевантной, чем страничка с текстом: «Александр утром встал, побрился, позвонил узнать, на работе ли Петр Сергеевич. Секретарь на этот вопрос вспылил: «А я что, Пушкин?! Откуда я знаю!?».
3. Количество ссылок на данную страницу (индекс цитируемости).
Чем больше на данную страницу ссылаются (ставят гиперссылку) другие страницы, тем больше вероятность того, что именно эта страница нужна пользователю.
4. Каким шрифтом (стилем) набрана на странице искомая фраза.
Если фраза написана крупным шрифтом (является заголовком) или выделена жирным - это тоже признак более высокой релевантности данной страницы.
5. Возраст сайта.
Чем дольше существует данный сайт, тем лучше это влияет на релевантность.
Таким образом, мы видим, что уровень релевантности - это целый комплекс всевозможных параметров, которые нужно не только получить и сохранить в поисковой базе, но и правильно интерпретировать.
Пишем поисковый запрос
«Кто ищет, тот всегда найдет!» - говорит пословица. И это правильно. Но для получения результата одного упорства мало, нужно еще и умение. То есть перед тем, как начать что-либо искать, нужно ясно и однозначно решить, что же именно вы ищете. Так же нужно подумать, каким образом сформулировать запрос, чтобы поисковая система как можно скорее выдала бы вам нужный результат. Потому как при всей своей сложности и продвинутости поисковой системы мысли ваши она все равно прочитать не в состоянии. И если вам вдруг остро захотелось найти сайт, посвященный росписи помещений с помощью кетчупа и майонеза, то одно только слово «майонез» в строке поисковика вряд ли сможет привести вас к хоть сколько-нибудь подходящему результату.
Конечно, можно написать большую инструкцию, посвященную всем тонкостям составления правильных запросов, вот только ее будет совсем неинтересно читать. Поэтому постараемся все свести к нескольким простым советам.
1. Проверяйте слова поискового запроса на наличие ошибок
Вы будете смеяться, но масса людей не могут найти сайты по интересующей их тематике и на все лады костерят поисковые системы, между тем как слово для поиска просто введено с ошибкой, и поисковик протирает жесткие диски до дыр, пытаясь отыскать «цилебная сила козьего малака», тогда как козы сроду не давали мАлАко, тем более цИлебное.
2. Используйте синонимы
Если поиск нужных результатов не принес, попробуйте переформулировать запрос, используя синонимы. Например, вместо «плоскогубцы» напишите «пассатижи», вместо «тачка» - «автомобиль», вместо «курсовая работа» - «реферат».
3. Уточняйте запрос
Чем точнее будет построен поисковый запрос, тем больше шансов, что в первых строках результата поиска будет нужный вам ресурс. Поэтому если вы ищете уже упоминавшуюся технологию росписи помещений с помощью кетчупа и майонеза, просто и тупо напишите это в строке поиска. Если результат вас не удовлетворит, то тогда уже начинайте варьировать строку.
4. Используйте ключевые слова
Если результат поиска вас не удовлетворил, включайте в поисковый запрос как можно больше уточняющих слов. Если вас интересует именно творчество Александра Сергеевича Пушкина, то в поисковой строке кроме непосредственно имени великого поэта обязательно введите слово "творчество". Если вы ищете информацию по автомобилю «Калина» - так и пишете «автомобиль Калина», а не просто «автомобиль».
5. Не пишите запрос в верхнем регистре
Все запросы желательно писать в нижнем регистре, потому что поиск обычно регистрозависимый, и строку «КОНДИЦИОНИРОВАНИЕ ВОЗДУХА В БОЛЬШИХ ПОМЕЩЕНИЯХ» вам найдут только в том случае, если она где-то на сайте набрана прописными буквами. Однако если вы ищете какие-то имена собственные - например, группу «Несчастный случай», а не сводку криминальных новостей, - тогда пишите их с прописных букв (именно с прописных, а не все прописными).
6. В сложных случаях используйте язык запросов
Практически все поисковые системы поддерживают так называемый язык запросов, позволяющий задавать мощнейшие комбинации различных критериев поиска. Но язык запросов - это отдельная тема, поэтому мы ее рассмотрим в следующем разделе.
Язык запросов
Допустим, вам нужно найти что-то, что можно описать фразой «мне нужно найти страницы, где есть слово «машина», но там не должно быть слова «битая», чтобы не более, чем через два слова от «машина» стояло слово «подержанная», чтобы сайт при этом находился в зоне ru и чтобы на этом сайте была ссылка на сайт www.e-rostov.ru» . Согласитесь, интересный запрос. Казалось бы, неосуществимый…
Однако вы вполне можете составить этот или подобный запрос безо всяких проблем, используя специальные символы в строке поиска, которые и называют языком запросов.
1.Исключение/включение определенных слов - знаки «+» и «-»
Предположим, вы хотите найти сайты, на которых можно найти книгу о Чапаеве, но совершенно не хочется читать анекдоты о нем. Тогда в запросе пишете следующее: «+книга +Чапаев -анекдот» - это означает команду искать страницы, на которых в обязательном порядке присутствуют слова «книга» и «Чапаев», однако отсутствует слово «анекдот».
2. Перечисление альтернатив - знак «|»
Вертикальная черта позволяет задать альтернативы: система ищет хотя бы одно из перечисленных слов. Например, если вы хотите найти страницы, где встречается одно из слов «папа», «мама», «дочка», «внучка», поисковый запрос будет выглядеть следующим образом: «папа | мама | дочка | внучка».
3. Поиск точного соответствия - знак «!»
Обычно поисковики ищут все словоформы введенного слова, даже если оно задано полностью: например, если в строке введено «Чапаев», то первыми будут выведены страницы, где встречается именно «Чапаев», но далее в результатах поиска окажутся «Чапаеву», «Чапаевым», «Чапаевых», «Чапаева» и так далее. Однако если вам нужно найти только данную конкретную форму - «Чапаев», - тогда задавайте поисковую строку так: «!Чапаев».
4. Поиск точной фразы - кавычки
Если вам нужна точная фраза «фузионный рекомбинатор», а не «фузионный резонатор, включающий в себя энергонезависимый рекомбинатор в синюю полосочку», тогда при поиске заключите фразу в кавычки: «фузионный рекомбинатор», и в этом случае поисковик выведет только те страницы, где эти слова располагаются строго рядом.
5. Задание расстояния между слов - «/n»
В случае, когда вы хотите найти все варианты фразы «подержанная [любое слово] машина» - можно отразить это неуемное желание в поисковом запросе с помощью знака «/», означающего «не превышало», и числа, показывающего допустимое количество слов, причем 1 - это значит отсутствие слов. Поясняю. Запрос «подержанная /+2 машина» означает команду искать все сочетания, где между «подержанная» и «машина» не больше 1 слова. То есть «подержанная машина» - подойдет, «подержанная синяя машина» - тоже подойдет, а «подержанная синяя ржавая машина» - уже нет. Значок «+» означает, что слово (слова) должно быть справа, а «-» - слева. То есть запрос «подержанная /(-2 4) машина» означает, что «подержанная» должно находиться от «машина» в интервале расстояний от 2 слов слева до 4 слов справа.
6. Ограничение по адресам - команда «#url»
Если вас интересует поиск, например, только на конкретном сервере или по конкретной группе адресов либо же, наоборот, поиск, который исключает конкретные адреса или группы адресов, можно воспользоваться командой #url=»адрес или группа». Например, если вы хотите найти все страницы, на которых встречается слово «изолятор», исключив сайт www.izjlyator.ru, дайте следующую команду: «изолятор ~~#url=»www.izjlyator.ru»».
7. Поиск ссылок - команда «#link»
Иногда (особенно это бывает актуальным для владельцев собственных страничек) бывает очень интересно узнать, какие сайты ссылаются (ставят гиперссылку) на тот или иной адрес. В этом случае достаточно в строке поиска задать следующие данные: «#link=»адрес»». То есть команда «#link=«www.e-rostov.ru»» покажет все страницы, где стоят ссылки на http://www.e-rostov.ru.ru/
Я перечислил только основные возможности языка запросов поисковой системы Яndex. Отмечу, что эти параметры, как правило, весьма похожи и в других поисковых системах, хотя в любом случае перед их использованием желательно посмотреть описание на конкретном поисковике.
Также следует иметь в виду, что практически каждый поисковик позволяет создавать довольно сложные запросы с помощью специальной формы под названием «расширенный поиск», для работы с которой вам уже не нужно знать, как именно работает язык запросов в данном поисковике.
Некоторые тонкости
При поиске в Интернете часто встречаются ситуации, когда хваленая релевантность ничем не сможет помочь. Например, захотелось вам почитать любимое с детства стихотворение Чуковского «Телефон». Только вот беда, название за давностью лет забыто, помнится только первая строчка – «У меня зазвонил телефон». Вводим эту строчку, нажимаем кнопку «Найти»… И получаете гору ссылок, в точности соответствующих запросу, но к детскому стихотворению не имеющих никакого отношения. Тут и статьи с точно так же звучащим названием, и информация о выставках коммуникационных технологий и много чего еще.… И поисковую систему вроде как ругать нельзя – все полученные результаты дословно соответствуют вашему запросу. Но если подумать и сделать уточнение – дописать в строке поиска слово «Чуковский», и найти требуемый текст станет вполне реальной задачей.
Так что ищите, и найдете. Удачи в деле поиска на просторах всемирной паутины!
Материал подготовил Кузнецов Алексей, E-Rostov
Спонсор статьи
Мало создать сайт, главное заставить его приносить прибыль. А как известно, без качественного продвижения сайта о прибыли можно и не мечтать. В компании "ПерфектСЕО" вы сможете заказать комплексный аудит вашего сайта. Наши специалисты бесплатно проконсультируют и помогут вам подобрать тот или иной вариант раскрутки.
|