Поисковые серверы. Некоторые правила поиска. Поисковой сервер: что это такое, перечень, достоинства и недостатки Поисковые системы интернета со значками

Что это

DuckDuckGo - это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo, Bing, «Википедии».

Чем лучше

DuckDuckGo позиционирует себя как поиск, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookie максимально ограничено.

DuckDuckGo не собирает личную информацию пользователей и не делится ею. Это наша политика конфиденциальности.

Гэбриел Вайнберг (Gabriel Weinberg), основатель DuckDuckGo

Зачем это вам

Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.

Формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на иностранных языках, тогда как Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на другом языке.


Что это

not Evil - система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный .

not Evil не единственный поисковик в своём роде. Есть LOOK (поиск по умолчанию в Tor-браузере, доступен из обычного интернета) или TORCH (один из самых старых поисковиков в Tor-сети) и другие. Мы остановились на not Evil из-за недвусмысленного намёка на Google (достаточно посмотреть на стартовую страницу).

Чем лучше

Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.

Зачем это вам

В сети Tor много ресурсов, которые невозможно встретить в законопослушном интернете. И их число будет расти по мере того, как ужесточается контроль властей над содержанием Сети. Tor - это своеобразная сеть внутри Сети со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.

3. YaCy

Что это

YaCy - децентрализованная поисковая система, работающая по принципу сетей P2P. Каждый компьютер, на котором установлен основной программный модуль, сканирует интернет самостоятельно, то есть является аналогом поискового робота. Полученные результаты собираются в общую базу, которую используют все участники YaCy.

Чем лучше

Здесь сложно говорить, лучше это или хуже, так как YaCy - это совершенно иной подход к организации поиска. Отсутствие единого сервера и компании-владельца делает результаты полностью независимыми от чьих-то предпочтений. Автономность каждого узла исключает цензуру. YaCy способен вести поиск в глубоком вебе и неиндексируемых сетях общего пользования.

Зачем это вам

Если вы сторонник открытого ПО и свободного интернета, не подверженного влиянию государственных органов и крупных корпораций, то YaCy - это ваш выбор. Также с его помощью можно организовать поиск внутри корпоративной или другой автономной сети. И пусть пока в быту YaCy не слишком полезен, он является достойной альтернативой Google с точки зрения процесса поиска.

4. Pipl

Что это

Pipl - система, предназначенная для поиска информации о конкретном человеке.

Чем лучше

Авторы Pipl утверждают, что их специализированные алгоритмы ищут эффективнее, чем «обычные» поисковики. В частности, приоритетными являются профили социальных сетей, комментарии, списки участников и различные базы данных, где публикуются сведения о людях, например базы судебных решений. Лидерство Pipl в этой области подтверждено оценками Lifehacker.com, TechCrunch и других изданий.

Зачем это вам

Если вам нужно найти информацию о человеке, проживающем в США, то Pipl будет намного эффективнее Google. Базы данных российских судов, видимо, недоступны для поисковика. Поэтому с гражданами России он справляется не так хорошо.

Что это

FindSounds - ещё один специализированный поисковик. Ищет в открытых источниках различные звуки: дом, природа, машины, люди и так далее. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнять поиск.

Чем лучше

В выдаче только звуки и ничего лишнего. В настройках можно выставить желаемый формат и качество звучания. Все найденные звуки доступны для скачивания. Имеется поиск по образцу.

Зачем это вам

Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это мы выбрали только из доступных русскоязычных запросов. На английском языке спектр ещё шире.

Если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?

Что это

Wolfram|Alpha - вычислительно-поисковая система. Вместо ссылок на статьи, содержащие ключевые слова, она выдаёт готовый ответ на запрос пользователя. Например, если ввести в форму поиска «сравнить население Нью-Йорка и Сан-Франциско» на английском, то Wolfram|Alpha сразу выведет на экран таблицы и графики со сравнением.

Чем лучше

Этот сервис лучше других подходит для поиска фактов и вычисления данных. Wolfram|Alpha накапливает и систематизирует доступные в Сети знания из различных областей, включая науку, культуру и развлечения. Если в этой базе находится готовый ответ на поисковый запрос, система показывает его, если нет - вычисляет и выводит результат. При этом пользователь видит только и ничего лишнего.

Зачем это вам

Если вы, например, студент, аналитик, журналист или научный сотрудник, то можете использовать Wolfram|Alpha для поиска и вычисления данных, связанных с вашей деятельностью. Сервис понимает не все запросы, но постоянно развивается и становится умнее.

Что это

Метапоисковик Dogpile выводит комбинированный список результатов из поисковых выдач Google, Yahoo и других популярных систем.

Чем лучше

Во-первых, Dogpile отображает меньше рекламы. Во-вторых, сервис использует особый алгоритм, чтобы находить и показывать лучшие результаты из разных поисковиков. Как утверждают разработчики Dogpile, их системы формирует самую полную выдачу во всём интернете.

Зачем это вам

Если вы не можете найти информацию в Google или другом стандартном поисковике, поищите её сразу в нескольких поисковиках с помощью Dogpile.

Что это

BoardReader - система для текстового поиска по форумам, сервисам вопросов и ответов и другим сообществам.

Чем лучше

Сервис позволяет сузить поле поиска до социальных площадок. Благодаря специальным фильтрам вы можете быстро находить посты и комментарии, которые соответствуют вашим критериям: языку, дате публикации и названию сайта.

Зачем это вам

BoardReader может пригодиться пиарщикам и другим специалистам в области медиа, которых интересует мнение массовой по тем или иным вопросам.

В заключение

Жизнь альтернативных поисковиков часто бывает скоротечной. О долгосрочных перспективах подобных проектов Лайфхакер спросил бывшего генерального директора украинского филиала компании «Яндекс» Сергея Петренко .


Сергей Петренко

Бывший генеральный директор «Яндекс.Украины».

Что касается судьбы альтернативных поисковиков, то она проста: быть очень нишевыми проектами с небольшой аудиторией, следовательно без ясных коммерческих перспектив или, наоборот, с полной ясностью их отсутствия.

Если посмотреть на примеры в статье, то видно, что такие поисковики либо специализируются в узкой, но востребованной нише, которая, возможно только пока, не выросла настолько, чтобы оказаться заметной на радарах Google или «Яндекса», либо тестируют оригинальную гипотезу в ранжировании, которая пока не применима в обычном поиске.

Например, если поиск по Tor вдруг окажется востребованным, то есть результаты оттуда понадобятся хотя бы проценту аудитории Google, то, конечно, обычные поисковики начнут решать проблему, как их найти и показать пользователю. Если поведение аудитории покажет, что заметной доле пользователей в заметном количестве запросов более релевантными кажутся результаты, данные без учёта факторов, зависящих от пользователя, то «Яндекс» или Google начнут давать такие результаты.

«Быть лучше» в контексте этой статьи не означает «быть лучше во всём». Да, во многих аспектах нашим героям далеко до и «Яндекса» (даже до Bing далековато). Но зато каждый из этих сервисов даёт пользователю нечто такое, чего не могут предложить гиганты поисковой индустрии. Наверняка вы тоже знаете подобные проекты. Поделитесь с нами - обсудим.

Цель урока:

  • Освоить основные понятия, связанные с поиском информации в глобальной сети.
  • Приобрести практические навыки работы с информационно-поисковыми системами.
  • Научиться применять программу Internet Explorer для поиска необходимой информации.

Ход урока

I . Мотивация и актуализация

1. Где взять интересующую информацию, если недоступны соответствующие книги и периодическая литература?

2. Как разобраться в огромном количестве информации глобальной компьютерной сети?

3. По каким принципам производить быстрый и эффективный поиск информации?

II . Представление темы, целей и ожидаемых результатов

Результатом данной работы должно стать следующее :

Ознакомление с поисковыми системами, принципами их работы и способами поиска;

Исследование структуры и возможностей выбранной поисковой системы;

Поиск и сохранение необходимой информации согласно заданию.

III . Подача необходимой информации

1. Поисковые серверы. Поисковые каталоги. Специализированные поисковые системы.

  1. Принцип работы поисковых систем. Поиск по ключевым словам.
  2. Общие сведения о синтаксисе языка запросов в поисковых системах.

Поисковые серверы

Сеть Интернет растёт очень быстрыми темпами, и найти нужную информацию среди де­сятка млн. документов становится всё сложнее. Для поиска информации используются специальные поисковые серверы, которые содержат более или менее полную и постоянно обновляемую информацию о Web-страницах, файлах и других документах, хранящихся на десятках миллионов серверов Интернет.

Различные поисковые серверы могут использовать различные поисковые механизмы по­иска, хранения и предоставления пользователю информации. Однако общим является то, что к моменту запроса пользователя вся информация о документах Интернет в компакт­ном виде хранится в базе данных поискового сервера.

Имеющиеся поисковые системы можно условно разделить на три группы:

1) справочники Интернет;

2) поисковые системы общего назначения;

3) специализированные поисковые системы;

Справочник Интернет (каталог) является аналогом тематического указателя в библиотеке: он предоставляет перечень наиболее важных документов по заданной теме. Примеры таких систем - поисковые серверы:

http://WWW.yahoo.com

http://narod.yandex.ru/rubrics/

Поисковые системы общего назначения позволяют находить документы во всемирной паутине по ключевым словам. Принцип, на котором основано большинство таких систем, состоит в том, что специальные программы – роботы автоматически «обходят» WWW-серверы, читают и индексируют все встречающиеся документы, выделяя при этом ключе­вые слова, относящиеся к данному документу, и запоминая их с URL этого документа в базе данных. Большинство поисковых систем разрешают также автору новые Web-стра­ницы самому внести информацию в базу данных.

Примером такой поисковой сис­темы является Rambler: http://www.rambler.ru

Специализированные поисковые системы позволяют находить вам информацию, нахо­дящуюся в других информационных «слоях» Интернет, смежных со всемирной паутиной, например, FTP-серверах. Примером такой системы является Lycos: http://ftpsearch.lycos.com

Так как информация в Интернет постоянно меняется, поисковые роботы не всегда успе­вают отследить все эти изменения. Информация, хранящаяся в базе данных поисковых серверов, может отличаться от реального состояния Интернет, и поэтому пользователь может получить ссылку на несуществующий или перемещённый документ.

Интерфейс поисковых систем примерно одинаков. Начальная страница поисковой сис­темы содержит список разделов, уточняющих область поиска, и поле поиска. В поле по­иска пользователь может ввести ключевые слова для поиска документа, то есть слова, ко­торые, по мнению пользователя, позволяют идентифицировать документ.

Как найти адрес (URL )?

Способов несколько. Самый простой способ – это увидеть доменные имена в различных рекламных материалах. В настоящее время любая уважающая себя фирма, в том числе любое издательство книг, журналов, редакции телеканалов имеют свой адрес в Internet и обычно указывают его на упаковке, в книгах, журналах, в эфире телепрограмм. Как пра­вило, указывается короткий адрес, состоящий только из доменного имени, например: http://www. life . com . ua . Введите такой адрес в адресную строку и гуляйте по сайту.

Но как быть, если адрес совершенно неизвестен? Для этого обратимся к хранилищам URL адресов, к специальным поисковым системам. Поисковые системы (поисковые каталоги, поисковые серверы) выполнены в виде Web-страниц, но на этих страницах располагается не информация как таковая, а аннотированные ссылки на другие ресурсы (страницы, сайты).

Для вызова поисковой системы необходимо в адресной строке программы Internet Explorer указать ее адрес. Поисковых систем в сети Internet сейчас достаточно много. В таблице ниже перечислены лишь наиболее популярные поисковые системы.

Наименование

Адрес

Яндекс (рус.)

http://www.yandex.ru

Rambler (рус.)

http://www.rambler.ru

Апорт (рус.)

http://www.aport.ru

Google (рус.)

http://www.google.com.ru

Как работает поисковая система? Первый этап работы поисковой системы – это индекси­рование информации , находящейся в Internet. Сетевой робот поисковой системы про­сматривает огромное количество страниц и заносит адреса и краткое содержание этих страниц к себе в базу данных, точнее в поисковый индекс . Владельцы сайтов будут очень рады, если их сайт просмотрит сетевой робот. Для того чтобы робот обязательно про­смотрел сайт и внес его в поисковый индекс, владельцы сами регистрируют свои сайты в поисковой системе (как правило, в нескольких поисковых системах). Процесс за­несения адреса и описания страницы в поисковую систему называется индексация . Второй этап работы поисковой системы – это выдача накоплен­ной и отобранной, отсортированной и классифицированной информации по запросам пользователей.

Поиск по ключевым словам

Наиболее простым и результативным поиском является поиск по ключевым словам . Таким поиском занимаются поисковые системы. Если, например, необходима информация о съемном жилье, то следует в строку поиска поисковой системы ввести следующую ключевую фразу:

В результате поисковая система предложит список наиболее подходящих сайтов по данному запросу.

Давайте подключимся к Internet, откроем программу Internet Explorer и введем в адресную строку адрес поисковой системы: http://www.yandex.ru. Мы подробно разберемся с прави­лами поиска по ключевым словам в поисковой системе Яндекс . В других системах эти правила могут отличаться, но основные положения будут идентичны.

Основной алгоритм поиска следующий:

1. ввести ключевые слова в поле запроса

2. нажать кнопку Найти .

После нажатия кнопки Найти , Яндекс выведет список ссылок на документы, наиболее точно соответствующие запросу.

Синтаксис языка запросов

В системе Яндекс существует специальный язык запросов , использовать который более сложно, чем форму расширенного поиска но при его использовании можно получить наилучший результат. Поисковый запрос вводится в поисковое поле, он может содержать ключевые слова и специальные символы , позволяющие установить взаимосвязи между этими словами и ввести дополнительные параметры. Некоторые из этих символов представлено в следующей таблице.

IV. Интерактивное упражнение

Задача : Найти предложенную информацию с помощью предложенных поисковых серверов.

Порядок работы:

1. Запишите в тетрадь адреса известных вам
- поисковых тематических каталогов___________________________
- поисковых серверов_________________________________________

2. Из заданного списка выберите русскоязычный поисковый сервер:
www.yandex.ru www . rambler . ru
www . google . com www.altavista.com
www.yahoo.com
www.aport.ru
www . meta . ua www.infoseek.com

3. По выбранному адресу загрузитеWeb-страницу сервера. Ознакомьтесь со структурой главной страницы.

4. Используя тематический каталог, найдите информацию о лекарстве “Аспирин”. Сохраните найденную информацию в файле Аспирин (С:Мои документы )

5. Методом поиска по ключевым словам найдите данные о космическом корабле многоразового использования “Буран”. Добавьте ссылку на найденный вами сайт в Избранное.

6. Найдите реферат на одну из предложенных тем:
- История возникновения компьютеров
- Компьютерные вирусы
- Электронная почта
- История возникновения Интернет
- Основные услуги сети Интернет.
Откройте реферат для просмотра. Сохраните его в папке С:Мои документы.

Для профессионального поиска в Интернете необходимы специализированный софт, а также специализированные поисковики и поисковые сервисы.

ПРОГРАММЫ

http://dr-watson.wix.com/home – программа предназначена для исследования массивов текстовой информации с целью выявления сущностей и связей между ними. Результат работы – отчет об исследуемом объекте.

http://www.fmsasg.com/ - одна из лучших в мире программ по визуализации связей и отношений Sentinel Vizualizer . Компания полностью русифицировала свои продукты и подключил горячую линию на русском.

http://www.newprosoft.com/ – “Web Content Extractor” является наиболее мощным, простым в использовании ПО извлечения данных из web сайтов. Имеет также эффективный Visual Web паук.

SiteSputnik не имеющий в мире аналогов программный комплекс, позволяющий вести поиск и обработку его результатов в Видимом и Невидимом Интернете, используя все необходимые пользователю поисковики.

WebSite-Watcher – позволяет проводить мониторинг веб-страниц, включая защищенные паролем, мониторинг форумов, RSS каналов, групп новостей, локальных файлов. Обладает мощной системой фильтров. Мониторинг ведется автоматически и поставляется в удобном для пользователя виде. Программа с расширенными функциями стоит 50 евро. Постоянно обновляется.

http://www.scribd.com/ – наиболее популярная в мире и все более широко применяемая в России платформа размещения различного рода документов, книг и т.п. для свободного доступа с очень удобным поисковиком по названиям, темам и т.п.

http://www.atlasti.com/ – представляет собой самый мощный и эффективный из доступных для индивидуальных пользователей, небольшого и даже среднего бизнеса инструмент качественного анализа информации. Программа многофункциональная и потому полезная. Совмещает в себе возможности создания единой информационной среды для работы с различными текстовыми, табличными, аудио и видеофайлами, как единым целым, а также инструменты качественного анализа и визуализации.

Ashampoo ClipFinder HD – все возрастающая доля информационного потока приходится на видео. Соответственно, конкурентным разведчикам нужны инструменты, позволяющие работать с этим форматом. Одним из таких продуктов является представляемая бесплатная утилита. Она позволяет осуществлять поиск роликов по заданным критериям на видеофайловых хранилищах типа YouTube. Программа проста в использовании, выводит на одну страницу все результаты поиска с подробными сведениями, названиями, длительностью, временем, когда видео было загружено в хранилище и т.п. Имеется русский интерфейс.

http://www.advego.ru/plagiatus/ – программа сделана seo оптимизаторами, но вполне подходит как инструмент интернет-разведки. Плагиатус показывает степень уникальности текста, источники текста, процент совпадения текста. Также программа проверяет уникальность указанного URL. Программа бесплатная.

http://neiron.ru/toolbar/ – включает надстройку для объединения поиска Google и Yandex, а также позволяет осуществлять конкурентный анализ, базирующийся на оценке эффективности сайтов и контекстной рекламы. Реализован как плагин для FF и GC.

http://web-data-extractor.net/ – универсальное решение для получения любых данных, доступных в интернете. Настройка вырезания данных с любой страницы производится в несколько кликов мыши. Вам нужно просто выбрать область данных, которую вы хотите сохранять и Datacol сам подберет формулу для вырезания этого блока.

CaptureSaver – профессиональный инструмент исследования интернета. Просто незаменимая рабочая программа, позволяющая захватывать, хранить и экспортировать любую интернет информацию, включая не только web страницы, блоги, но и RSS новости, электронную почту, изображения и многое другое. Обладает широчайшим функционалом, интуитивно понятным интерфейсом и смешной ценой.

http://www.orbiscope.net/en/software.html – система веб мониторинга по более чем доступным ценам.

http://www.kbcrawl.co.uk/ – программное обеспечение для работы, в том числе в «Невидимом интернете».

http://www.copernic.com/en/products/agent/index.html – программа позволяет вести поиск, используя более 90 поисковых систем, более чем по 10 параметрам. Позволяет объединять результаты, устранять дубликаты, блокировать нерабочие ссылки, показывать наиболее релевантные результаты. Поставляется в бесплатной, личной и профессиональной версиях. Используется больше чем 20 млн.пользователей.

Maltego – принципиально новое программное обеспечение, позволяющее устанавливать взаимосвязь субъектов, событий и объектов в реале и в интернете.

СЕРВИСЫ

new – эффективный поисковик-агрегатор для поиска людей в основных российских социальных сетях.

https://hunter.io/ – эффективный сервис для обнаружения и проверки email.

https://www.whatruns.com/ – простой в использовании, но эффективный сканер, позволяющий обнаружить, что работает и не работает на веб-сайте и каковы дыры в безопасности. Реализован также как плагин к Chrom.

https://www.crayon.co/ – американская бюджетная платформа рыночной и конкурентной разведки в интернете.

http://www.cs.cornell.edu/~bwong/octant/ – определитель хостов.

https://iplogger.ru/ – простой и удобный сервис для определения чужого IP .

http://linkurio.us/ – новый мощный продукт для работников экономической безопасности и расследователей коррупции. Обрабатывает и визуализирует огромные массивы неструктурированной информации из финансовых источников.

http://www.intelsuite.com/en – англоязычная онлайн платформа для конкурентной разведки и мониторинга.

http://yewno.com/about/ – первая действующая система перевода информации в знания и визуализации неструктурированной информации. В настоящее время поддерживает английский, французский, немецкий, испанский и португальский языки.

https://start.avalancheonline.ru/landing/?next=%2F – прогнозно-аналитические сервисы Андрея Масаловича.

https://www.outwit.com/products/hub/ – полный набор автономных программ для профессиональной работы в web 1.

https://github.com/search?q=user%3Acmlh+maltego – расширения для Maltego.

http://www.whoishostingthis.com/ – поисковик по хостингу, IP адресам и т.п.

http ://appfollow .ru / – анализ приложений на основе отзывов, ASO оптимизации, позиций в топах и поисковых выдачах для App Store , Google Play и Windows Phone Store .

http://spiraldb.com/ – сервис, реализованный как плагин к Chrom , позволяющий получить множество ценной информации о любом электронном ресурсе.

https://millie.northernlight.com/dashboard.php?id=93 - бесплатный сервис, собирающий и структурирующий ключевую информацию по отраслям и компаниям. Есть возможность использования информационных панелей основанных на текстовом анализе.

http://byratino.info/ – сбор фактографических данных из общедоступных источников в сети Интернет.

http://www.datafox.co/ – CI платформа собирающая и анализирующая информацию по интересующим клиентов компаниям. Есть демо.

https://unwiredlabs.com/home - специализированное приложение с API для поиска по геолокации любого устройства, подключенного к интернету.

http://visualping.io/ – сервис мониторинга сайтов и в первую очередь имеющихся на них фотографий и изображений. Даже если фотография появилась на секунду, она будет в электронной почте подписчика. Имеет плагин для G oogleC hrome.

http://spyonweb.com/ – исследовательский инструмент, позволяющий осуществить глубокий анализ любого интернет-ресурса.

http://bigvisor.ru/ – сервис позволяет отслеживать рекламные компании по определенным сегментам товаров и услуг, либо конкретным организациям.

http://www.itsec.pro/2013/09/microsoft-word.html – инструкция Артема Агеева по использованию программ Windows для нужд конкурентной разведки.

http://granoproject.org/ – инструмент с открытым исходным кодом для исследователей, которые отслеживают сети связей между персонами и организациями в политике, экономике, криминале и т.п. Позволяет соединять, анализировать и визуализировать сведения, полученные из различных источников, а также показывать существенные связи.

http://imgops.com/ – сервис извлечения метаданных из графических файлов и работы с ними.

http://sergeybelove.ru/tools/one-button-scan/ – маленький он-лайн сканер для проверки дыр безопасности сайтов и других ресурсов.

http://isce-library.net/epi.aspx – сервис поиска первоисточников по фрагменту текста на английском языке

https://www.rivaliq.com/ – эффективный инструмент для ведения конкурентной разведки на западных, в первую очередь, европейских и американских рынках товаров и услуг.

http://watchthatpage.com/ – сервис, который позволяет автоматически собирать новую информацию с поставленных на мониторинг ресурсов в интернете. Услуги сервиса бесплатные.

http://falcon.io/ – своего рода Rapportive для Web. Он не является заменой Rapportive, а дает дополнительные инструменты. В отличие от Rapportive дает общий профиль человека, как бы склеенный из данных из социальных сетей и упоминаний в web.http://watchthatpage.com/ – сервис, который позволяет автоматически собирать новую информацию с поставленных на мониторинг ресурсов в интернете. Услуги сервиса бесплатные.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – дополнение для Firefox. Следит за обновлениями web-страниц. Полезно для web-сайтов, которые не имеют лент новостей (Atom или RSS).

http://agregator.pro/ – агрегатор новостных и медийных порталов. Используется маркетологами, аналитиками и т.п. для анализа новостных потоков по тем или иным темам.

http://price.apishops.com/ – автоматизированный веб-сервис мониторинга цен по выбранным товарным группам, конкретным интернет-магазинам и другим параметрам.

http://www.la0.ru/ – удобный и релевантный сервис анализа ссылок и бэклинков на интернет-ресурс.

www.recordedfuture.com – мощный инструмент анализа данных и их визуализации, реализованный как он-лайн сервис, построенный на «облачных» вычислениях.

http://advse.ru/ – сервис под слоганом «Узнай все про своих конкурентов». Позволяет в соответствии с поисковыми запросами получить сайты конкурентов, анализировать рекламные компании конкурентов в Google и Yandex.

http://spyonweb.com/ – сервис позволяет определить сайты с одинаковыми характеристиками, в том числе, использующими одинаковые идентификаторы сервиса статистики Google Analytics, IP адреса и т.п.

http://www.connotate.com/solutions – линейка продуктов для конкурентной разведки, управления информационными потоками и преобразования сведений в информационные активы. Включает как сложные платформы, так и простые дешевые сервисы, позволяющие эффективно вести мониторинг вместе с компрессией информации и получением только нужных результатов.

http://www.clearci.com/ – платформа конкурентной разведки для бизнеса различных размеров от стартапов и маленьких компаний до компаний из списка Fortune 500. Решена как saas.

http://startingpage.com/ – надстройка на Google, позволяющая вести поиск в Google без фиксации вашего IP адреса. Полностью поддерживает все поисковые возможности Google, в том числе и а русском языке.

http://newspapermap.com/ – уникальный сервис, очень полезный для конкурентного разведчика. Соединяет геолокацию с поисковиком он-лайн медиа. Т.е. вы выбираете интересующий вас регион или даже город, или язык, на карте видите место и список он-лайн версий газет и журналов, нажимаете на соответствующую кнопку и читаете. Поддерживает русский язык, очень удобный интерфейс.

http://infostream.com.ua/ – очень удобная отличающаяся первоклассной выборкой, вполне доступная для любого кошелька система мониторинга новостей «Инфострим» от одного из классиков интернет-поиска Д.В.Ландэ.

http://www.instapaper.com/ – очень простой и эффективный инструмент для сохранения необходимых веб-страниц. Может использоваться на компьютерах, айфонах, айпадах и др.

http://screen-scraper.com/ – позволяет автоматически извлекать всю информацию с веб-страниц, скачивать подавляющее большинство форматов файлов, автоматически вводить данные в различные формы. Скачанные файлы и страницы сохраняет в базах данных, выполняет множество других чрезвычайно полезных функций. Работает под всеми основными платформами, имеет полнофункциональную бесплатную и очень мощные профессиональные версии.

http://www.mozenda.com/- имеющий несколько тарифных планов и доступный даже для малого бизнеса веб сервис многофункционального веб мониторинга и доставки с избранных сайтов необходимой пользователю информации.

http://www.recipdonor.com/ - сервис позволяет осуществлять автоматический мониторинг всего происходящего на сайтах конкурентов.

http://www.spyfu.com/ – а это, если у вас конкуренты иностранные.

www.webground.su – созданный профессионалами Интернет-поиска сервис для мониторинга Рунета, включающий всех основных поставщиков информации, новостей и т.п., способен к индивидуальным настройкам мониторинга под нужды пользователя.

ПОИСКОВИКИ

https ://www .idmarch .org / – лучший по качеству выдачи поисковик мирового архива pdf документов. В настоящее время проиндексировано более 18 млн. pdf документов, начиная от книг, заканчивая секретными отчетами.

http://www.marketvisual.com/ – уникальный поисковик, позволяющий вести поиск собственников и топ-менеджмента по ФИО, наименованию компании, занимаемой позиции или их комбинации. В поисковой выдаче содержатся не только искомые объекты, но и их связи. Рассчитана прежде всего на англоязычные страны.

http://worldc.am/ – поисковик по фотографиям в свободном доступе с привязкой к геолокации.

https://app.echosec.net/ – общедоступный поисковик, который характеризует себя как самый продвинутый аналитический инструмент для правоохранительных органов и профессионалов безопасности и разведки. Позволяет вести поиск фотографий, размещенных на различных сайтах, социальных платформах и в социальных сетях в привязке к конкретным геолокационным координатам. В настоящее время подключено семь источников данных. До конца года их число составит более 450. За наводку спасибо Дементию.

http://www.quandl.com/ – поисковик по семи миллионам финансовых, экономических и социальных баз данных.

http://bitzakaz.ru/ – поисковик по тендерам и госзаказам с дополнительными платными функциями

Website-Finder – дает возможность найти сайты, которые плохо индексирует Google. Единственным ограничением является то, что для каждого ключевого слова он ищет только 30 веб-сайтов. Программа проста в использовании.

http://www.dtsearch.com/ – мощнейший поисковик, позволяющий обрабатывать терабайты текста. Работает на рабочем столе, в интернете и в интранете. Поддерживает как статические, так и динамические данные. Позволяет искать во всех программах MS Office. Поиск ведется по фразам, словам, тегам, индексам и многому другому. Единственная доступная система федеративного поиска. Имеет как платную, так и бесплатную версии.

http://www.strategator.com/ – осуществляет поиск, фильтрацию и агрегацию информации о компании из десятка тысяч веб-источников. Ищет по США, Великобритании, основным странам ЕЭС. Отличается высокой релевантностью, удобностью для пользователя, имеет бесплатные и платный вариант (14$ в месяц).

http://www.shodanhq.com/ – необычный поисковик. Сразу после появления получил кличку «Гугл для хакеров». Ищет не страницы, а определяет IP адреса, типы роутеров, компьютеров, серверов и рабочих станций, размещенных по тому или иному адресу, прослеживает цепочки DNS серверов и позволяет реализовать много других интересных функций для конкурентной разведки.

http://search.usa.gov/ – поисковик по сайтам и открытым базам всех государственных учреждений США. В базах находится много практической полезной информации, в том числе и для использования в нашей стране.

http://visual.ly/ – сегодня все шире для представления данных используется визуализация. Это первый поисковик инфографики в Вебе. Одновременно с поисковиком на портале есть мощные инструменты визуализации данных, не требующие навыков программирования.

http://go.mail.ru/realtime –поиск по обсуждениям тем, событий, объектов, субъектов в режиме реального, либо настраиваемого времени. Ранее крайне критикуемый поиск в Mail.ru работает очень эффективно и дает интересную релевантную выдачу.

Zanran – только что стартовавший, но уже отлично работающий первый и единственный поисковик для данных, извлекающий их из файлов PDF, таблиц EXCEL, данных на страницах HTML.

http://www.ciradar.com/Competitive-Analysis.aspx – одна из лучших в мире систем поиска информации для конкурентной разведки в «глубоком вебе». Извлекает практически все виды файлов во всех форматах по интересующей теме. Реализована как веб-сервис. Цены более чем приемлемые.

http://public.ru/ – Эффективный поиск и профессиональный анализ информации, архив СМИ с 1990 года. Интернет-библиотека СМИ предлагает широкий спектр информационных услуг: от доступа к электронным архивам публикаций русскоязычных СМИ и готовых тематических обзоров прессы до индивидуального мониторинга и эксклюзивных аналитических исследований, выполненных по материалам печати.

Cluuz – молодой поисковик с широкими возможностями для конкурентной разведки, особенно, в англоязычном интернете. Позволяет не только находить, но и визуализировать, устанавливать связи между людьми, компаниями, доменами, e-mail, адресами и т.п.

www.wolframalpha.com – поисковик завтрашнего дня. На поисковый запрос выдает имеющуюся по объекту запроса статистическую и фактологическую информацию, в том числе, визуализированную.

www.ist-budget.ru – универсальный поиск по базам данных госзакупок, торгов, аукционов и т.п.

Поисковые серверы. Некоторые правила поиска

Для организации поиска в Интернете существуют специализированные службы, называемые поисковыми серверами. На практике – это веб-сайты, где можно набрать в соответствующей строке ключевые слова, касающиеся интересующей темы, и получить множество ссылок на ресурсы с нужной информацией. Например, на запрос домашние животные поисковый сервер «Яндекс» (подробнее о нем см. ниже) выдает более 14 млн ссылок на страницы, содержащие нужные, на его взгляд, сведения. Однако далеко не все так гладко: при посещении некоторых найденных страниц выясняется, что искомой информации на них недостаточно, а то и вовсе нет.

Чтобы искать с максимальной результативностью, нелишне будет знать, как работают поисковые серверы.

Принципы работы поисковых серверов

Поисковый сервер – это довольно сложная программа, точнее, комплекс программ, в которых используются специальные алгоритмы анализа содержимого веб-сайтов в масштабах всего Интернета.

Интересный момент: на обработку того же запроса домашние животные у «Яндекса» ушло менее секунды. Невольно возникает вопрос: «А можно ли проанализировать весь Интернет за столь короткое время?» Однозначный ответ на это: «За столь короткое время проанализировать весь Интернет нельзя». Тем не менее факт остается фактом: на обработку запроса затрачено меньше секунды. Ответом на возникшее недоразумение будет описание принципов работы поисковых серверов.

Работа над запросом конкретного пользователя (а заодно и над всеми другими возможными запросами) началась задолго до его введения. Специальная программа, называемая «пауком», просматривает содержимое веб-сайтов. Ее задачи чем-то схожи с задачами обычного веб-браузера, только вместо того, чтобы показывать страницы на экране, «паук» передает их содержимое другой программе – «путешествующему пауку». Задача «путешествующего паука» – вычленение из загруженной страницы ссылок на другие сайты, по которым снова направляется «паук». Цикл этот повторяется многократно, точнее, непрерывно.

На этом работа не заканчивается. За дело принимается программа-индексатор, которая, используя определенные правила, анализирует полученные «пауками» страницы и формирует сложную базу данных поискового сервера. Вот эта самая база данных потом и выдает результаты поиска, которые появляются после обработки введенного запроса. На принципах работы индексатора остановимся подробнее, так как именно от него зависит то, что войдет в результаты поиска.

В основе работы большинства современных поисковиков лежит индекс цитирования, который вычисляется индексатором в результате анализа ссылок на текущую страницу с других страниц Интернета. Чем их больше, тем выше индекс цитирования анализируемой страницы и тем выше эта страница будет отображена в результатах поиска. Кроме того, учитывается индекс цитирования страниц, которые ссылаются на страницу, изучаемую индексатором.

Кроме индекса цитирования учитываются также следующие параметры:

Наличие искомых слов в заголовке страницы или названии сайта;

Частота повторений искомых слов на странице;

Размер шрифта, которым на странице написаны слова из поискового запроса, а также выделение этих слов шрифтами и стилями;

Тематика ссылающихся сайтов и некоторые другие.

После ввода запроса пользователем за дело берется последнее звено поискового сервера – система выдачи результатов. В итоге анализа и сопоставления упомянутых выше показателей эта система определяет степень соответствия содержимого страницы условиям запроса. Чем эта степень больше, тем выше станица будет представлена в списке найденных ресурсов.

Возвращаясь к вопросу о скорости обработки запроса, отмечу, что такая высокая скорость обеспечивается за счет того, что страницы Интернета проиндексированы заранее, а результаты поиска составляются на основе информации из базы данных поискового сервера.

Такой способ, как несложно догадаться, имеет очевидный недостаток, заключающийся в том, что содержимое веб-страниц может со временем изменяться, а «паук» не будет успевать найти их и обработать, следовательно, результаты поиска будут неточными. Еще раз упомянув о времени, необходимом поисковому серверу для просмотра и индексации всего Интернета, скажу, что на это у разных поисковиков уходит от нескольких суток до нескольких недель, в зависимости от алгоритма обработки информации. Так что сайты, появившиеся в Сети недавно, в результатах поиска представлены не будут.

Разработчики поисковых серверов борются с этим явлением разными способами и с переменным успехом. Например, большинство современных поисковиков предоставляет такой сервис, как поиск по новостным лентам, которые обновляются каждые несколько минут и поэтому чаще индексируются поисковиками. Как бы там ни было, лучшего способа, чем предварительная индексация страниц, сегодня не существует.

Правила построения поисковых запросов

Как уже отмечалось, в Интернете существует множество поисковых серверов, отечественных и зарубежных.

Российские поисковые серверы:

«Яндекс» – http://www.yandex.ru;

«Рамблер» – http://www.rambler.ru;

«Апорт» – http://www.aport.ru;

Gogo – http://www.gogo.ru.

Зарубежные поисковые серверы:

Google – http://www.google.com;

AltaVista – http://www.altavista.com;

Yahoo! – http://www.yahoo.com.

Для поиска на русском языке лучше подходят российские серверы, на иностранном – зарубежные, хотя, например, Google неплохо справляется с поиском на многих языках. Подробнее о наиболее популярных поисковых системах поговорим позже, рассматривая расширенные возможности поиска, так как у каждой из этих систем есть свои особенности. Сейчас остановимся на некоторых базовых правилах построения поисковых запросов, общих для всех поисковиков.

Несмотря на заявления многих владельцев поисковых серверов, что запросы могут быть написаны практически на естественном языке, который люди используют для общения между собой, это далеко не так. По всей видимости, еще не скоро наступит время, когда компьютер и человек смогут общаться на естественном (для человека) языке. Впрочем, нужно отдать должное поисковым серверам, в последнее время они стали гораздо лучше понимать пользователя и результаты поиска теперь больше соответствуют ожиданиям, чем это было несколько лет назад. Произошло это во многом благодаря внедрению новых языковых технологий.

Из вышесказанного следует, что на практике рядовому пользователю находить нужную информацию стало проще. Поисковики теперь ищут не только запрашиваемое слово, но и его словоформы, что позволяет делать результаты поиска более точными. Например, если в поисковом запросе присутствует слово умный, то его результаты будут содержать не только это слово, но и его производные: умного, умная, а также ум и даже разум. Конечно, страницы со словоформами будут не в числе первых результатов поиска, но элементы искусственного интеллекта налицо. Этот факт полезно учитывать при построении поисковых запросов. Теперь расскажу еще о нескольких таких фактах.

Поисковые серверы при обработке запроса не учитывают регистр символов. Поэтому запросы Отдых в Турции и отдых в турции с точки зрения поисковика идентичны.

Также следует помнить, что применять знаки препинания в поисковых запросах вовсе не обязательно, точнее, даже не нужно, так как они также игнорируются поисковыми серверами. Зато многие традиционные знаки препинания могут быть использованы при построении сложных, расширенных запросов, результаты поиска по которым обычно гораздо ближе к ожидаемым.

Большинство поисковых серверов (кроме, пожалуй, Google) также игнорирует короткие слова, не несущие смысловой нагрузки. В русском языке это предлоги, союзы и т. д., в иностранных – например, артикли.

Многие поисковые серверы позволяют бороться с опечатками и неправильной раскладкой клавиатуры. Наверняка многим читателям часто случалось набрать при включенной английской раскладке клавиатуры русское слово, и получалось, например, gfhjdjp вместо паровоз. Тот же «Яндекс» сразу определит, что здесь что-то не так, и вверху страницы с результатами поиска выдаст ссылку Быть может, вы искали: паровоз, перейдя по которой можно получить страницу с правильными результатами. Аналогично можно бороться с опечатками. Если поисковому серверу покажется, что в слове допущена ошибка или опечатка, то он предупредит об этом той же фразой Быть может, вы искали…

Поговорим о том, какие слова лучше взять для запроса поисковому серверу. Во-первых, из интересующей пользователя темы нужно взять самые важные по смыслу слова, отражающие только сущность вопроса. Например, если необходим материал по теме «Ловля пингвинов в Антарктиде в условиях полярной ночи», то вовсе не обязательно писать фразу целиком, результаты поиска в этом случае, скорее всего не устроят запрашивающего, так как будет много лишнего. Есть выражение «Машина должна работать, человек – думать», и сказано оно как раз о такой ситуации. Задача пользователя при составлении поискового запроса – выделить ключевые слова, задача поискового сервера – наилучшим образом обработать введенный запрос. В рассматриваемом примере ключевыми можно считать слова ловля пингвинов. Ведь известно, что, кроме Антарктиды, они нигде больше не водятся, ну а «полярную ночь» стоит отбросить хотя бы потому, что в реальности в таких условиях работать достаточно сложно.

Этот ироничный пример иллюстрирует, что пользователь, основываясь на своих знаниях и логике, должен выделить только необходимые ключевые слова, не перегружая запрос лишними терминами.

Рассмотрим пример, иллюстрирующий типичные ошибки начинающих пользователей при поиске в Интернете. На запрос загадки о музыкальных инструментах поисковик не выдал полезных результатов. Тогда пользователь решает исправить запрос, дополнив его и написав: загадки для детей о музыкальных инструментах, – результаты поиска оказались еще хуже предыдущего. В такой ситуации говорят, что условия запроса стали более жесткими, в отличие от более мягких, установленных в предыдущем случае. Для данного примера неплохим решением, как показала практика, явился поиск по ключевому слову загадки. В Интернете много таких сайтов, а зайдя на сам сайт и немного поискав по его разделам, вполне можно найти интересующую информацию.

Рассуждая о том, какие слова нужно использовать в поисковом запросе, можно сформулировать несколько правил:

Выбирайте только самые важные, ключевые слова, касающиеся рассматриваемой темы;

Слов не должно быть слишком много или слишком мало; некоторые считают оптимальным запрос, состоящий из трех-четырех слов, однако в разных случаях это количество может различаться;

При неудовлетворительных результатах поиска попробуйте применить более мягкие условия для запроса, но ни в коем случае не более жесткие;

Если вы не удовлетворены результатами поиска на одном поисковом сервере, то попробуйте поискать на другом; механизмы работы у серверов неодинаковые, так что результаты могут различаться коренным образом.

Надеюсь, что вышеизложенная информация поможет читателям находить в Сети необходимые сведения. Если найти что-то все равно никак не удается, то на помощь придут расширенные методы поиска.

Из книги Продвижение бизнеса в Интернет. Все о PR и рекламе в сети автора Гуров Филипп

Поисковые системы Поисковые системы (англ. search engine) представляют собой инструменты для поиска информации в Сети. Они индексируют сайты с помощью специальных программ (поисковых роботов). Когда посетители поисковой системы задают тот или иной вопрос, она ранжирует

Из книги Защита вашего компьютера автора Яремчук Сергей Акимович

7.3. Некоторые правила поведения пользователя в Интернете Популярность веб-форумов, онлайн-дневников (блогов) и различных средств общения вроде электронной почты, групп новостей, различных чатов сегодня велика. Кроме добропорядочных пользователей эти сервисы привлекают

Из книги Win2K FAQ (v. 6.0) автора Шашков Алексей

Некоторые правила использования Интернета В семье нужно определить, что является приемлемым при пользовании Интернетом, а что – нет. При этом поощряйте детей делиться впечатлениями, выходите в Интернет вместе, контролируйте ресурсы, которые посещает ребенок. Объясните,

Из книги WinXP FAQ (Часто задаваемые вопросы по ОС Windows XP) автора Шашков Алексей

(8.7) Под W2k не хотят работать некоторые программы, требующие интенсивного обращения к CD приводу, такие как Audiograbber, CDEx, программы для записи CD-RW, некоторые DVD декодеры, и т. д.. Многие программы, требующие непрерывного потока данных идущих на или с CD/DVD привод, нуждаются в

Из книги Популярный самоучитель работы в Интернете автора Кондратьев Геннадий Геннадьевич

7.4. Под XP не хотят работать некоторые программы, требующие интенсивного обращения к CD приводу, такие как Audiograbber, CDEx, программы для записи CD-RW, некоторые DVD декодеры, и т. д.. Многие программы, требующие непрерывного потока данных идущих на или с CD/DVD привод, нуждаются в

Из книги Реферат, курсовая, диплом на компьютере автора

Поисковые системы

Из книги Интернет. Новые возможности. Трюки и эффекты автора Баловсяк Надежда Васильевна

Поисковые машины Если вам необходимо получить подборку материалов по более конкретной и специальной информации, лучше воспользоваться поисковыми машинами. Поисковая машина – это комплекс специальных программ для поиска в Сети. Они лишены недостатков, присущих

Из книги 500 лучших программ для Windows автора Уваров Сергей Сергеевич

Поисковые программы В последнее время наряду с онлайновыми поисковыми машинами появляются и другие инструменты, предназначенные для поиска в Интернете. Одним из таких инструментов являются поисковые программы. Особенностью их работы является возможность искать сразу

Из книги Программирование на языке Пролог для искусственного интеллекта автора Братко Иван

Поисковые системы Пользователи, работающие в Сети, довольно часто применяют поисковые системы. Конечно, часть информации изначально ищется на тематических ресурсам, однако наиболее популярные поисковые системы также активно используются. Начал появляться класс

Из книги Интернет – легко и просто! автора Александров Егор

8.3.1. Некоторые правила хорошего стиля Предложения программы должны быть короткими. Их тела, как правило, должны содержать только несколько целей. Процедуры должны быть короткими, поскольку длинные процедуры трудны для понимания. Тем не менее длинные процедуры

Из книги С компьютером на ты. Самое необходимое автора Егоров А. А.

Поисковые системы Чтобы поиск в Интернете был удобным, быстрым и эффективным, созданы специальные поисковые системы. Убежден, что практически каждый сеанс вашей работы в Интернете не обойдется без того, чтобы вы не воспользовались любимой поисковой системой. Поэтому

Из книги Первые шаги с Windows 7. Руководство для начинающих автора Колисниченко Денис Н.

Поисковые системы Регистрация в поисковых системах – это важнейший шаг при раскрутке своего сайта, так как подавляющее большинство пользователей Интернета ищут инфор -мацию именно с помощью поисковых сайтов. Однако бездумная регистрация не сильно повысит

Из книги ПК без напряга автора Жвалевский Андрей Валентинович

8.2. Поисковые системы Для быстрого и удобного поиска информации во Всемирной паутине существуют специальные сайты - поисковые системы. В разд. 6.2 я уже упоминал об одной такой системе - Яндексе (http://www.yandex.ru). Кроме Яндекса существует еще несколько популярных поисковых

Из книги Работа в Интернете. Энциклопедия автора Ташков Петр Андреевич

10.2.1. Поисковые машины Интернет содержит огромное количество информации. Ведь в Интернете создать сайт может любой желающий, поэтому количество новых сайтов растет с каждым днем. Для поиска в Интернете используются поисковые машины.Поисковая машина - это специальный

Из книги автора

Поисковые системы Это адреса, которые вы должны запомнить прежде всего и крепко-накрепко. С помощью поисковых систем можно отыскать любой другой сайт в

Из книги автора

Поисковые серверы. Некоторые правила поиска Для организации поиска в Интернете существуют специализированные службы, называемые поисковыми серверами. На практике – это веб-сайты, где можно набрать в соответствующей строке ключевые слова, касающиеся интересующей темы,

Поисковики помогают пользователям интернета найти нужную информацию. В строке поиска человек вводит свой запрос: ключевое слово для поиска или сборник ключевых слов. И выбирает из списка понравившийся сайт, лучше всего отражающий суть заданного вопроса поисковой системе. Поисковые серверы интернета - это удобно и современно.

Обзор поисковых серверов

Обрабатывает сотни гигабайт информации и выдаёт пользователю нужные сайты в удобном формате списка найденных страниц. Этот список может состоять из сотен тысяч страниц, где встречаются эти слова. Из этого всего вы уже можете найти нужную информацию, это временами может быть и проблематично. А иногда вы сразу находите нужный сайт с соответствующей информацией.

Поисковой сервер AltaVista - самый малоизвестный поисковик в "Рунете". Был популярен у англоязычной аудитории во время запуска системы "Виста" от "Майкрософт". В его базе всего лишь пятьсот пятьдесят миллионов страниц. Четыре миллиона статей из 15.000 групп новостей внутри агрегатора "Юзенет". И доступен поиск по изображениям и прочим медийным файлам, типа видео и звуков. Выдача по картинкам производится в немного неудобном формате. Они выводятся все с описанием размера при наведении мышки на картинку.

Open Directory Project - этот сервис, скорее, относится к каталогам, чем к поисковикам. Но через него поиск осуществляется только по качественным ресурсам Сети интернет. Работу для удобства пользователей осуществляет около 38 тысяч редакторов, которые ежедневно отбирают сайты для своего каталога.

Поисковой сервер WebCrawler - количество индекса поискового сервиса около 1,6 миллиона проиндексированных материалов. Каталог проекта имеет около 100 000 категорий, куда можно определить практически любой сайт. У поисковика общая база данных с другим интернет проектом под названием Excite, но данный проект специализируется на развлекательном трафике, индексируя чаты и гороскопы.

Lycos - в этом сервере есть информация о 50-ти миллионах страниц. Вам приведены запросы к поисковому серверу. Вы можете написать, например: «Как написать статью для сайта», и поисковик выдаст нужную информацию. Отсортированы они релевантно вашему запросу. Возможно, среди них вы найдёте нужный. Приведены запросы к поисковому серверу для каждого поисковика ниже.

HotBot - содержит в себе информацию о 55 миллионах страниц со всего интернета. Среди них вы сможете найти нужную информацию. Для удобства можете указать нужное гео-положение. Например, вы ищете кафе в определённом городе и задаёте соответствующий запрос. Поисковик также совершает поиск по звукам, графике, скриптам сайта, и прочим нетривиальным вещам, которые могут быть вам нужны. Сервер недавно подключился к "Юзенет", и поиск также может совершаться там.

"Гугл" и "Яху" - гиганты поиска

Поисковой сервер "Гугл" (Google) - за всё время работы проиндексировано уже около 2-х миллиардов страниц, по которым производится поиск интересующего пользователя контента. "Рунет" проиндексирован неплохо, но лучше "Яндекса" "Гугл" не стал, поскольку тот учитывает индивидуальные особенности русского языка, орфографию и орфоэпию слов при поиске.

Поисковой сервер Яху (Yahoo!) - имеет развитый сервис новостей, собираемый из СМИ всего мира. В нём проиндексировано около 3 000 000 ссылок. Сервис достаточно неплохо структурирован. Является одним из первых в мире. Но не стал таким популярным как "Гугл".

Метасистемы

Кроме классических поисковых систем существуют метасистемы, которые осуществляют поиск сразу по всем системам сразу. Результаты будут представлены в удобном для вас виде. Сервис "Яндекс" - самый крупный в "Рунете" и первый в своём роде. После поисковик распространился и по странам СНГ, поскольку учитывает морфологию языка. Программа Copernic 2001 работает достаточно давно и постоянно обновляет свою базу данных от различных сервисов. Поиск может осуществляться по категориям или по геоданным. Выдача может быть привязана к местности, из которой поступает запрос.

Существует бесплатная и платная версия сервиса, которым пользуется уже больше четырнадцати миллионов человек. Сервер использует для поиска "Гугл", "Яндекс", и прочие.

"Рамблер" и "Яндекс" - крупнейшие каталоги сайтов

Rambler - российский сайт, который предоставляет услуги по поиску нужной информации в интернете. Поисковик достаточно молодой, но уже набравший популярность в России и СНГ, присутствует свой каталог и агрегатор новостей, в которых представлено огромное количество русскоязычных сайтов. Является крупнейшим в СНГ, после него идет "Яндекс", который обходит его по качеству. В "Яндекс" попасть достаточно сложно для малоизвестных сайтов. В "Рамблере" же регистрация является бесплатной для всех порталов, удовлетворяющих условиям принятия проекта в каталог.

Поиск файлов

"ФТП-индекс". В нём находится информация о ФТП-серверах, которые используются для хранения и распространения информации. Но информация в виде файлов.

Filez - с его помощью можно просматривать более чем 100 миллионов файлов, находящихся в индексе файлового поисковика.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: