1 этап. Разговор в круге
Как часто вы пользуетесь службой поиска? Всегда ли вы находите то, что ищете? В чем заключается основная ваша проблема? Считаете ли вы себя профессионалом в процедуре поиска? Что, по вашему мнению, может считаться критерием профессиональности поиска? (полнота и достоверность результатов поиска, высокая скорость процедуры поиска)
2 этап. Знакомство с новым материалом, выделение нового в известном (работа с Презентацией)
Что включает в себя “Профессиональный поиск в Интернет”? – ответы на вопросы – Как? (искать) Что? (искать) Где? (искать)
Давайте начнем с простого: ГДЕ?
Работа с понятиями: поисковая машина, поисковая система, каталог.
Реальными носителями информации о ресурсах, которыми располагает Сеть, являются поисковые машины (автоматические индексы) и каталоги. В силу того, что они, хотя и различными средствами, самостоятельно обеспечивают все этапы обработки информации от ее получения с узлов-первоисточников до предоставления пользователю возможности поиска, их часто называют автономными системами.
Поисковые машины Поисковые машины каждый день "ползают" по Сети: они посещают веб-страницы и заносят их в гигантские базы данных. 10 первых ссылок обладают достаточной релевантностью к запросу
Поисковые машины: (spiders, crawlers) постоянно
исследуют Сеть с целью пополнения своих баз
данных документов. Обычно это не требует никаких
усилий со стороны человека. Примером может быть
поисковая система Altavista.
Для поисковых систем довольно важна конструкция
каждого документа. Большое значение имеют title,
meta-таги и содержимое страницы.
Действие поисковых машин заключается в постоянном последовательном исследовании всех узлов Интернет, доступных данной системе поиска, со всеми их связями и ответвлениями. В связи с постоянным обновлением информации машина поиска регулярно возвращается через определенный срок (порядка месяца) к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернет.
При поступлении запроса от пользователя машина поиска рассматривает всю индексированную информацию и выдает список документов, соответствующих задаче поиска. Найденные документы ранжируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления в тексте.
Несмотря на схожий принцип работы, машины поиска различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты.
Каталоги: в отличие от поисковых машин в
каталог информация заносится по инициативе
человека. Добавляемая страница должна быть
жестко привязана к принятым в каталоге
категориям. Примером каталога может служить Yahoo.
Конструкция страниц значения не имеет. Каталоги
Каталоги являются справочниками, содержащими списки адресов Интернет, сгруппированные по определенным признакам. Как правило, они объединяются по тематике (наука, искусство, новости и т.д.), где каждая тема разветвляется на несколько подуровней.
Особенность этих средств поиска информации состоит в том, что создание структуры, базы данных и их постоянное обновление осуществляется "вручную", коллективом редакторов и программистов, и сам процесс поиска требует непосредственного участия пользователя, самостоятельно переходящего от ссылки к ссылке.
Сравнение поисковых систем:
Где лучше у них? (анализ данных таблицы, ребята получают их на руки)
Поисковая машина |
AltaVista |
Excite |
HotBot |
InfoSeek |
Lycos |
Northern Light |
Web Crawler |
Показатели индексирования |
|||||||
Размер индекса в млн. документов | 150 | 55 | 110 | 45 | 50 | 140 | 2 |
Скорость индексирования, документов в день | 10 млн. | 3 млн. | до 10 млн. | Нет данных | от 6 до 10 млн. | более 3 млн. | Нет данных |
Время регистрации | 1–2 дня | 2 недели | 2 недели | 2 дня | 2–3 недели | 2–4 недели | 2 недели |
Учет частоты обновления | Да | Нет | Нет | Да | Нет | Нет | Нет |
Особенности поисковых языков |
|||||||
Поиск по домену | Да | Нет | Да | Да | Да | Нет | Нет |
Поиск по URL | Да | Нет | Нет | Да | Да | Да | Нет |
Учет регистра | Да | Нет | Частично | Да | Нет | Частично | Нет |
Поиск по заголовку | Да | Нет | Да | Да | Да | Да | Нет |
Поддержка кириллицы | Да | Нет | Нет | Да | Да | Да | Нет |
Гед лучше у нас? (анализ данных)
Распределение трафика с поисковых машин в российском интернете |
|
Рамблер |
|
Яндекс |
49,03% |
Апорт |
2,38% |
12,8% |
|
5,07% |
Приготовленные (загружены в компьютерах) страницы поиска во всех указанных российских поисковых системах позволяют выявить наиболее удачные варианты представления результатов запроса (отсутствие лишней рекламы, объявлений, возможности уточнения параметров поиска)
Второй вопрос: ЧТО?
Процедура поиска еще один важный элемент профессионализма. Остановимся на нескольких важных моментах, связанных с планированием и первыми шагами поисковой процедуры.
Начинать обычно приходится со всестороннего лексического анализа информации, подлежащей поиску: подробного и грамотного описания исследуемого вопроса, максимально широкий набор ключевых слов в виде отдельных терминов, словосочетаний, профессиональной лексики и клише, фамилий, тесно связанных c проблемой.
Технологический этап Используются тестовые запросы из 1–2 ключевых слов или фразы, затем анализируется количественный отклик.
Третий, но не маловажный, вопрос: КАК?
Простой запрос из одного слова
Если в запросе задано слово с большой буквы, будут найдены только слова в таком написании, а если с маленькой – оба варианта. К примеру, запрос в форме слова "Козлов" позволит ограничиться ссылками на фамилию, отсекая упоминания о соответствующих животных, за исключением их использования с большой буквы – например, в начале предложения.
Простой запрос из множества слов
Яndex позволяет использовать в качестве запроса строку до 250 символов. Для введения простого запроса нужно набрать в строке запроса ключевые слова, разделенные пробелом. Простой запрос подразумевает, что слова связаны логическим оператором ИЛИ, т. е. машина ищет документы, в которых упоминается хотя бы одно из этих слов, и на выходе их ранжирует по количеству найденных слов, их весу, частотным характеристикам, близости в тексте и другим параметрам. Учитывается морфология всех терминов простого запроса.
Поиск без учета морфологии
Чтобы зафиксировать словоформу без рассмотрения машиной ее морфологических вариаций в строке запроса перед термином ставится знак "!".
Поиск с оператором И
В строгом варианте запроса используются операторы, логические выражения, специальные функции. Оператор ИЛИ в строгом запросе обозначается запятой. Оператор И (&) означает, что текст должен содержать все термины или логические выражения, соединенные данным оператором. В языке запросов Яndex один значок оператора означает его действие в пределах абзаца, а два подряд – в пределах всего текста.
Оператор НЕ
В языке Яndex этот оператор обозначается "~", и так же его одинарное использование означает исключение следующего за ним термина в пределах абзаца, а двойное – в пределах всего текста.
Поиск по словосочетанию или фразе
Искомое словосочетание в запросе заключается в кавычки.
Сложный запрос
Яndex позволяет использовать вместо слов целые логические выражения, при этом его нужно заключить в скобки.
Поиск в найденном
Позволяет осуществить поиск по документам, найденным по предыдущему запросу. Для этого в конце запроса нужно поставить "$$" или просто сделать отметку в окошке "поиск в найденном", расположенном на странице запроса. Эта функция очень удобна для последовательного сужения поиска.
Поиск с расстоянием
Яndex позволяет задавать порядок следования и расстояние между словами. Расстояние между словами А и В равно: 1 (В следует сразу за А), 2 (В следует за А через одно слово) и т.д. Или – 1 (В стоит перед А), – 2 … Знак "/" между словами, за которым стоит число, означает, что расстояние между ними не должно превышать этого числа слов.
3 этап. Организация игры по теме
Ребятам предлагается найти как можно больше ответов на заданные вопросы. При этом учитывается точность ответов. Искать можно в любой поисковой системе, но не более двух вопросов одновременно. Время поиска 20 минут.
4 этап. Подведение итогов – разговор к круге
Как вы оцениваете свои успехи в игре? Помог ли вам новый материал по теме? Что для вас самое трудное в процедуре поиска? Какие советы вы можете дать своим друзьям на своем опыте?
А ват мои советы вам:
Не забывайте о команде Find браузера
Если ваш браузер имеет в меню Файл, Правка или Вид команду Find (Найти), используйте ее для обнаружения трудноуловимых ключевых слов страницы. Чтобы отыскать слово, которое вам нужно, воспользуйтесь комбинацией клавиш CTRL+F в вашем броузере и введите искомое ключевое слово.
Фиксируйте результаты ссылками и закладками
1. Сохраняйте ссылки на важные и часто посещаемые страницы, используя команду Добавить в "Избранное". Используйте подобные механизмы для регистрации предварительных результатов поиска в процессе беглого отбора с целью дальнейшего подробного изучения.
2. Поддерживайте свою персональную коллекцию ссылок в рабочем состоянии: актуализируйте и систематизируйте ее, удаляйте устаревшие и ненужные.
3. Некоторые машины поиска, например AltaVista, позволяют отмечать закладкой успешный результат поиска. Благодаря этому позднее можно вернуться к данной подборке документов и просмотреть ее.
4. Существуют специализированные программные средства – интегрируемые модули расширения для стандартных броузеров, которые индексируют информационные ресурсы ранее посещаемых узлов. Они способны выполнять полнотекстовый поиск документов на любом узле, включая результаты обработки запросов.
Сохраняйте копии важных документов
Активно используйте команды контекстного меню Сохранить объект как… и Сохранить рисунок как… и команду меню Файл – Сохранить как… для создания копий необходимой вам информации из сети Интернет на локальном ресурсе вашего ПК. Этим вы решите некоторые проблемы:
1) изменчивости и недолговечности WWW (когда со своих адресов со временем исчезают страницы и целые сайты);
2) концентрации внимания исключительно на целях определенного этапа поиска (например отбор адресов или предварительный просмотр найденной информации);
3) экономии времени on-line подключения и перевод изучения отобранных материалов в режим off-line.
Отключайте вывод изображений
Если вы не желаете видеть многочисленные рекламные заставки и для вас важен не дизайн сайтов, а их содержательная информация, измените заданный режим просмотра в броузере на режим вывода только текста (исключив возможности мультимедиа). Это значительно увеличит скорость поиска. При этом, если возникнет необходимость быстрого просмотра важной графической информации, воспользуйтесь пунктом контекстного меню Показать рисунок, кликнув для его вызова правой кнопкой мыши в место невыведенного рисунка.
Не теряйте самоконтроль
Интерактивная среда WWW увлекает, и зачастую после нескольких десятков минут Web-серфинга мы забываем: как попали на данный сайт, что хотели найти и по какому адресу расположена только что просмотренная уникальная информация… И в этом случае не пренебрегайте аккуратным использованием функциями (кнопками) вашего броузера Назад и Вперед, помогающими упорядочить навигацию. Чтобы не терять информацию и время, приучите себя всегда явно определять цель предстоящего on-line сеанса и при работе стараться не отступать от нее, оставляя прочие возникающие идеи и желания на потом. Планирование поисковой работы по этапам также даст результат: поиск станет более осознанным и систематичным, а результат – более полным и точным.
Список использованных источников информации:
М.Талантов Профессиональный поиск в Интернете: планирование поисковой процедуры, журнал “КомпьютерПресс”, № 7 (1999)
Степанов В.К. “Поиск информации”
http://www.openweb.ru/windows/stepanov/f_texts/w_search.htm
"Системы поиска информации в Интернет"
http://www.edimo.ru/win/search/index.htm
http://www.park.ru/INFO/info?w+internet/search
http://www.ortv.ru/internet/tools/search.htm
"Полный список средств поиска в Русском Вебе"
http://www.rinet.ru:8080/buki/slistsur.html
"Поисковые системы" Кешелава В.
http://www.acea.neva.ru/win/search/search.web/it4.htm
http://www.moris.rosmail.com/references/search.html