Увійти
Жіночий інформаційний портал
  • Підвищуємо безпеку максимально!
  • Який процесор кращий: AMD або Intel
  • Пам'ятка з використання мови запитів
  • У процесі реалізації інформаційного пошуку слід керуватися низкою загальних методичних рекомендацій
  • Пошук інформації може бути проведений за декількома методами, що значно розрізняються як за ефективністю та якістю пошуку, так і за типом видобутої інформації
  • Вибираємо тв антену для дачі
  • Пошукові інструменти. Пам'ятка з використання мови запитів

    Пошукові інструменти.  Пам'ятка з використання мови запитів

    Відеоурок: Як створити запити в Microsoft Access за 10 хвилин

    Лекція: Використання інструментів пошукових систем (формування запитів)

    Найважливішими функціями при роботі з базами даних є фільтр інформації, пошук та запит.


    Сортування- Це процес упорядкування інформації за деякою ознакою. Буває зростаюча і спадна сортування. Якщо база даних має числову інформацію, то як сортування використовують ранжування, а якщо йдеться про текстову інформацію, то користуються сортуванням за абеткою.


    При розгляді сортування системами управління базами даних MS Access сортування здійснюється в межах одного поля. Якщо використовується нове сортування, то попередні його результати губляться. Якщо сортування вкладене, виконати його можна за допомогою запиту.


    Фільтр- Це відбір інформації, необхідної користувачеві. Можна встановити складні умови відбору.

    Щоб знайти деякі дані, можна використовувати спеціальні символи, які називаються маскою:


    * – означає, що можна вибрати будь-яку кількість символів.

    ? – замість цього знака може бути будь-який символ, який можна використовувати.

    # – замість цього символу може стояти будь-яка цифра.

    – будь-які символи, що стоять у дужках.

    - – будь-який символ, який відповідає вибраному діапазону.

    ! – будь-який символ, крім тих, що укладені у квадратних дужках.

    Даний фільтр за знаками можна використовувати для всієї таблиці, або вже відібраної за деякими критеріями частини даних.

    Запит- дана функція носить масштабний характер і може містити як сортування, так і фільтрацію. Ця функція дозволяє проводити відбір даних у кількох полях та таблицях. Можна створювати бібліотеку запитів, яка зберігається для майбутнього використання. Існує спеціальна мова запитів SQL – структурована.

    1. Введення

    З кожним роком обсяги Інтернету збільшуються в рази, тому можливість знайти необхідну інформацію різко зростає. Інтернет поєднує мільйони комп'ютерів, безліч різних мереж, кількість користувачів збільшується на 15-80% щорічно. І, тим не менш, все частіше при зверненні до Інтернету основною проблемою виявляється не відсутність шуканої інформації, а можливість її знайти. Як правило, звичайна людина через різні обставини не може або не хоче витрачати на пошук потрібної їй відповіді більше 15-20 хвилин. Тому особливо актуально правильно і грамотно навчитися, здавалося б, простої речі – де і як шукати, щоб отримувати БАЖАНІ відповіді.

    Щоб знайти потрібну інформацію, потрібно знайти її адресу. Для цього існують спеціалізовані пошукові сервери (роботи індексів (пошукові системи), тематичні Інтернет-каталоги, системи мета-пошуку, служби пошуку людей тощо). У цьому майстер-класі розкриваються основні технології пошуку інформації в Інтернеті, надаються загальні риси пошукових інструментів, розглядаються структури пошукових запитів для найпопулярніших російськомовних та англомовних пошукових систем.

    2. Технології пошуку

    Web-технологія World Wide Web (WWW) вважається спеціальною технологією підготовки та розміщення документів у мережі Інтернет. До складу WWW входять і web-сторінки, і електронні бібліотеки, каталоги та навіть віртуальні музеї! За такої великої кількості інформації гостро постає питання: «Як зорієнтуватися в такому величезному та масштабному інформаційному просторі?»
    У вирішенні цієї проблеми на допомогу приходять пошукові інструменти.

    2.1 Пошукові інструменти

    Пошукові інструменти – це особливе програмне забезпечення, основна мета якого – забезпечити найбільш оптимальний та якісний пошук інформації для користувачів Інтернету. Пошукові інструменти розміщуються на спеціальних веб-серверах, кожен з яких виконує певну функцію:

    1. Аналіз веб-сторінок та занесення результатів аналізу на той чи інший рівень бази даних пошукового сервера.
    2. Пошук інформації на запит користувача.
    3. Забезпечення зручного інтерфейсу для пошуку інформації та перегляду результату пошуку користувачем.

    Прийоми роботи, які використовуються під час роботи з тими чи іншими пошуковими інструментами, практично однакові. Перед тим як перейти до їх обговорення, розглянемо такі поняття:

    1. Інтерфейс пошукового інструменту представлений у вигляді сторінки з гіперпосиланнями, рядком подання запиту (рядком пошуку) та інструментами активізації запиту.
    2. Індекс пошукової системи – це інформаційна база, що містить результат аналізу веб-сторінок, складена за певними правилами.
    3. Запит – це ключове слово або фраза, яку користувач вводить у рядок пошуку. Для формування різних запитів використовують спеціальні символи ("", ~), математичні символи (*, +, ?).

    Схема пошуку інформації в Інтернеті проста. Користувач набирає ключову фразу та активізує пошук, тим самим отримує добірку документів за сформульованим (заданим) запитом. Цей список документів ранжується за певними критеріями так, щоб зверху списку опинилися ті документи, які найбільше відповідають запиту користувача. Кожен із пошукових інструментів використовує різні критерії ранжирування документів, як під час аналізу результатів пошуку, і під час формування індексу (наповнення індексної бази даних web-страниц).

    Таким чином, якщо вказати у рядку пошуку для кожного пошукового інструменту однакової конструкції запит, можна отримати різні результати пошуку. Для користувача має велике значення, які документи виявляться у перших двох-трьох десятках документів за результатами пошуку та наскільки ці документи відповідають очікуванням користувача.

    Більшість пошукових інструментів пропонують два способи пошуку. simple search(простий пошук) та advanced search(розширений пошук) з використанням спеціальної форми запиту та без неї. Розглянемо обидва види пошуку на прикладі англомовної пошукової машини.

    Наприклад, AltaVista зручно використовувати для довільних запитів, "Something about online degrees in information technology", тоді як пошуковий інструмент Yahoo дозволяє отримувати світові новини, інформацію про курс валют або прогноз погоди.

    Освоєння критеріїв уточнення запиту та прийомів розширеного пошуку, дозволяє збільшувати ефективність пошуку та досить швидко знайти необхідну інформацію. Насамперед, збільшити ефективність пошуку Ви можете за рахунок використання у запитах логічних операторів (операцій) Or, And, Near, Not, математичних та спеціальних символів. За допомогою операторів та/або символів користувач пов'язує ключові слова у потрібній послідовності, щоб отримати найбільш адекватний запит результат пошуку. Форми запитів наведено у таблиці 1.

    Таблиця 1

    Простий запит дає кілька посилань на документи, т.к. до списку потрапляють документи, що містять одне зі слів, введених під час запиту, або просте словосполучення (див. таблицю 1). Оператор and дозволяє вказати на те, що до змісту документа повинні бути включені всі ключові слова. Тим не менш, кількість документів може бути ще великою, і їх перегляд займе достатньо часу. Тому в ряді випадків набагато зручніше застосувати контекстний оператор near, що вказує на те, що слова повинні розташовуватися в документі в достатній близькості. Використання близько зменшує кількість знайдених документів. Наявність символу "*" у рядку запиту означає, що здійснюватиметься пошук слова за його маскою. Наприклад, отримаємо список документів, що містять слова, що починаються на gov, якщо в рядку запиту запишемо gov *. Це може бути слова government, governor тощо.

    Не менш популярна пошукова система Rambler веде статистику відвідуваності посилань з власної бази даних, підтримуються ті ж логічні оператори. слів, що вводяться в запит.

    Давайте розглянемо найпопулярніші технології пошуку інформації в Інтернеті.

    2.2 Пошукові машини (search engines)

    Машини веб-пошуку - це сервери з величезною базою даних URL-адрес, які автоматично звертаються до сторінок WWW на всі ці адреси, вивчають вміст цих сторінок, формують і прописують ключові слова зі сторінок у свою базу даних (індексує сторінки).

    Більше того, роботи пошукових систем переходять за посиланнями, що зустрічаються на сторінках, і переіндексують їх. Так як майже будь-яка сторінка WWW має безліч посилань на інші сторінки, то при подібній роботі пошукова машина зрештою теоретично може обійти всі сайти в Інтернет.

    Саме цей вид пошукових інструментів є найбільш відомим та популярним серед усіх користувачів мережі Інтернет. Кожен на слуху назви відомих машин веб-пошуку (пошукових систем) – Яndex, Rambler, Aport.

    Щоб скористатися даним видом пошукового інструменту, необхідно зайти на нього і набрати в рядку пошуку ключове слово, що Вас цікавить. Далі Ви отримаєте видачу з посилань, що зберігаються в базі пошукової системи, які найбільш близькі до Вашого запиту. Щоб пошук був найбільш ефективним, заздалегідь зверніть увагу на такі моменти:

    • визначтеся з темою запиту. Що саме зрештою Ви хочете знайти?
    • звертайте увагу на мову, граматику, використання різних небуквенних символів, морфологію. Важливо також правильно сформулювати та вписати ключові слова. Кожна пошукова система має форму складання запиту - принцип один, але можуть відрізнятися використовувані символи чи оператори. Необхідні форми запиту різняться також залежно від складності програмного забезпечення пошукових систем та послуг, що надаються ними. Так чи інакше, кожна пошукова система має розділ "Help" ("Допомога"), де всі синтаксичні правила, а також рекомендації та поради щодо пошуку, доступно пояснюються (скриншот сторінок пошукових систем).
    • використовуйте можливості різних пошукових систем. Якщо ви не знайшли на Яndex, спробуйте на Google. Користуйтеся послугами розширеного пошуку.
    • Щоб виключити документи, які містять певні терміни, скористайтеся символом "-" перед кожним таким словом. Наприклад, якщо Вам потрібна інформація про роботи Шекспіра, за винятком "Гамлета", введіть запит у вигляді: "Шекспір-Гамлет". І для того, щоб, навпаки, результати пошуку обов'язково включалися певні посилання, використовуйте символ "+". Так, щоб знайти посилання про продаж саме автомобілів, Вам потрібен запит "продаж+автомобіль". Для збільшення ефективності та точності пошуку використовуйте комбінації цих символів.
    • кожне посилання у списку результатів пошуку містить кілька рядків зі знайденого документа, серед яких зустрічаються Ваші ключові слова. Перш ніж переходити за посиланням, оцініть відповідність сниппета темі запиту. Перейшовши на певний сайт, уважно окиньте поглядом головну сторінку. Як правило, першої сторінки достатньо, щоб зрозуміти – на адресу Ви прийшли чи ні. Якщо так, то подальші пошуки потрібної інформації ведіть на вибраному сайті (у розділах сайту), якщо ні – повертайтеся до результатів пошуку та спробуйте ще одне посилання.
    • пам'ятайте, що пошукові системи не виробляють самостійну інформацію (за винятком роз'яснень про себе). Пошукова система – це лише посередник між власником інформації (сайтом) та Вами. Бази даних постійно оновлюються, до них вносяться нові адреси, але відставання від реально існуючої у світі інформації все одно залишається. Просто тому, що пошукові системи не працюють зі швидкістю світла.

    До найвідоміших машин веб-пошуку відносяться Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Серед російськомовних можна назвати Яndex, Rambler, Апорт.

    Пошукові системи є наймасштабнішими та найціннішими, але далеко не єдиними джерелами інформації в Мережі, адже крім них існують інші способи пошуку в Інтернеті.

    2.3 Каталоги (directories)

    Каталог Інтернет-ресурсів – це ієрархічний каталог, що постійно оновлюється і поповнюється, що містить безліч категорій та окремих web-серверів з коротким описом їх вмісту. Однією з переваг тематичних каталогів є те, що пояснення до посилань дають творці каталогу і повністю відображають його зміст, тобто дає можливість точніше визначити, наскільки відповідає зміст сервера мети Вашого пошуку.

    Прикладом тематичного російськомовного каталогу можна назвати ресурс http://www.ulitka.ru/.

    На головній сторінці цього сайту розташований тематичний рубрикатор,

    за допомогою якого користувач потрапляє в рубрику з посиланнями на продукцію, що його цікавить.

    Крім того, деякі тематичні каталоги дають змогу шукати за ключовими словами. Користувач вводить необхідне ключове слово у рядок пошуку

    та отримує список посилань з описами сайтів, які найбільш повно відповідають його запиту. Варто відзначити, що цей пошук відбувається не у вмісті WWW-серверів, а в їх короткому описі, що зберігаються в каталозі.

    У нашому прикладі у каталозі також є можливість сортування сайтів за кількістю відвідувань, за алфавітом, за датою занесення.

    Інші приклади російськомовних каталогів:
    Каталог@Mail.ru
    Weblist
    Vsego.ru
    Серед англомовних каталогів можна виділити:
    http://www.DMOS.org
    http://www.yahoo.com/
    http://www.looksmart.com

    2.4 Добірки посилань

    Добірки посилань – це відсортовані на теми посилання. Вони досить сильно відрізняються один від одного за наповненням, тому щоб знайти добірку, яка найбільш повно відповідає Вашим інтересам, необхідно ходити по них самостійно, щоб скласти власну думку.

    Як приклад наведемо Підбірку посилань "Скарби Інтернет" АТ "Релком"

    Користувач, натискаючи на будь-яку з рубрик, що його зацікавили.

  • ЗМІСТ

    Автомобілістам

    • Астрономія та астрологія
    • Ваш будинок
    • Ваші вихованці
    • Діти квіти життя
    • Дозвілля
    • Міста в Мережі Internet
    • Здоров'я та медицина
    • Інформаційні агенції та служби
    • Краєзнавчий музей тощо,
    • Автомобільні електроніки.
    • Музей старовини автомото.
    • Колегія правового захисту автовласників.
    • Sportdrive.

    Перевагою такого виду пошукових інструментів є їх цілеспрямованість, зазвичай добірка включає рідкісні інтернет ресурси, підібрані конкретним веб-майстром або господарем інтернет сторінки.

    2.5 Бази даних адрес (addresses database)

    Бази даних адрес - це спеціальні пошукові сервери, які зазвичай використовують класифікації за родом діяльності, по продукції, що випускається і послуг, за географічною ознакою. Іноді вони доповнені пошуком за абеткою. У записах бази даних зберігається інформація про сайти, які надають інформацію про електронну адресу, організацію та поштову адресу за певну плату.

    Найбільшою англомовною базою даних адрес можна назвати: http://www.lookup.com/ -

    Потрапляючи в дані піддиректорії, користувач виявляє посилання на сайти, які і пропонують інформацію, що його цікавить.

    Широко доступних та офіційних баз даних адрес в РФ нам невідомо.

    2.6 Пошук у архівах Gopher (Gopher archives)

    Gopher - це взаємозалежна система серверів (Gopher-простір), розподілена по Інтернету.

    У просторі Gopher зібрана найбагатша літературна бібліотека, проте матеріали недоступні для перегляду у віддаленому режимі: користувач може лише переглядати ієрархічно організований зміст та вибирати файл за назвою. За допомогою спеціальної програми (Veronica) такий пошук можна зробити автоматично, використовуючи запити, побудовані на ключових словах.

    До 1995 року Gopher був найдинамічнішою технологією Інтернет: темпи зростання кількості відповідних серверів випереджали темпи зростання серверів інших типів Інтернет. У мережі EUnet/Relcom активного розвитку сервери Gopher не отримали і сьогодні про них практично ніхто не згадує.

    2.7 Система пошуку FTP файлів (FTP Search)

    Система пошуку FTP-файлів - це особливий тип засобів пошуку в Інтернеті, який дозволяє знаходити файли, доступні на "анонімних" FTP-серверах. Протокол FTP призначений передачі по мережі файлів, й у сенсі він функціонально є своєрідним аналогом Gopher.

    Основним критерієм пошуку є назва файлу, що задається різними способами (точна відповідність, підрядок, регулярне вираження тощо). Даний тип пошуку, звичайно ж, не може змагатися за можливостями з пошуковими машинами, так як вміст файлів ніяк не враховується при пошуку, а файли, як відомо, можна давати довільні імена. Тим не менш, якщо Вам потрібно знайти якусь відому програму або опис стандарту, то з великою ймовірністю файл, що містить його, буде мати відповідне ім'я, і ​​Ви зможете знайти його за допомогою одного з серверів FTP Search :

    FileSearch шукає файли на FTP-серверах на ім'я самих файлів і каталогів. Якщо Ви шукаєте якусь програму або ще щось, то на WWW-серверах Ви скоріше знайдете їх опис, а з FTP-серверів Ви зможете перекачати їх до себе.

    2.8 Система пошуку у конференціях Usenet News

    USENET NEWS – це система телеконференцій спільноти мереж Інтернету. На Заході цей сервіс прийнято називати новинами. Близьким аналогом телеконференцій є і так звані "ехи" у мережі FIDO.

    З точки зору абонента телеконференції, USENET являють собою дошку оголошень, в якій є розділи, де можна знайти статті на будь-яку тему - від політики до садівництва. Ця дошка оголошень доступна через комп'ютер, подібно до електронної пошти. Не відходячи від комп'ютера, можна читати або поміщати статті на ту чи іншу конференцію, знайти корисну пораду або вступати в дискусії. Звичайно, статті займають місце на комп'ютерах, тому не зберігаються вічно, а періодично знищуються, звільняючи місце для нових. У всьому світі найкращим сервісом для пошуку інформації у конференціях Usenet є сервер Google Groups (Google Inc.).

    Групи Google – це безкоштовна інтерактивна спільнота та служба груп обговорень, яка пропонує найбільший в Інтернеті архів повідомлень мережі Usenet (більше мільярда повідомлень). /googlegroups/tour/index.html

    Серед російськомовних виділяється сервер Всесвітня система USENET та телеконференції Relcom. Так само, як і в інших пошукових службах, користувач набирає рядок запиту, а сервер формує список конференцій, що містять ключові слова. Далі треба підписатися на відібрані конференції у програмі роботи з новинами. Також має місце аналогічний російський сервер FidoNet Online: конференція Fido на WWW.

    2.9 Системи мета-пошуку

    Для швидкого пошуку в базах декількох пошукових систем краще звернутися до систем мета-пошуку.

    Системи мета-пошуку - це пошукові машини, які посилають Ваш запит на величезну кількість різних пошукових систем, потім обробляють отримані результати, видаляють повторювані адреси ресурсів і представляють ширший спектр того, що представлено в Інтернеті.

    Найбільш популярна у світі система мета-пошуку Search.com.

    Об'єднаний пошуковий сервер Search.com компанії CNET, Inc. включає майже два десятки пошукових систем, посиланнями на які рясніє весь Інтернет.

    За допомогою цього виду пошукових інструментів користувач може шукати інформацію в багатьох пошукових системах, проте негативною стороною даних систем можна назвати їх нестабільність.

    2.10 Системи пошуку людей

    Системи пошуку людей – це спеціальні сервери, які дозволяють здійснювати пошук людей в Інтернет, користувач може вказати П.І.Б. людину і отримати його адресу електронної пошти та URL-адресу. Проте, слід зазначити, що системи пошуку людей, переважно, беруть інформацію про електронних адресах з відкритих джерел, як-от конференції Usenet. Серед найвідоміших систем пошуку людей можна виділити:

    Пошук адрес e-mail

    у спеціальні графи пошуку контактні дані (First Name. City, Last Name, Phone number), Ви можете знайти цікаву для Вас інформацію.

    Системи пошуку людей - це справді великі сервери, їх бази даних містять близько 6 000 000 адрес.

    3. Висновок

    Ми розглянули основні технології пошуку інформації в Інтернет і представили загалом пошукові інструменти, які існують на даний момент в Інтернеті, а також структуру пошукових запитів для найбільш популярних російськомовних та англомовних пошукових систем і, підбиваючи підсумок вищесказаного, хочемо відзначити, що єдиної оптимальної схеми пошуку інформації в Інтернеті не існує. Залежно від специфіки потрібної інформації, Ви можете використовувати відповідні пошукові інструменти та служби. А від того, наскільки грамотно будуть підібрані пошукові служби, залежить якість результатів пошуку.

  • Лекція 4. Інструменти інформаційного пошуку

    Постійне оновлення інформаційного масиву у поєднанні з приростом обсягу даних вкрай ускладнює облік наявних документів і, відповідно, пошук, який умовно можна поділити на:

    • фактографічний пошук:в енциклопедіях, довідниках, словниках,
    • бібліографічний пошук:бібліотеки, каталоги, програми.
    • документальний пошук:електронні документи, електронні бібліотеки, електронні журнали.

    Важливість проблеми інформаційного пошуку призвела до утворення цілої галузі, завдання якої полягає саме у наданні допомоги користувачеві з навігації у кіберпросторі. Складають цю галузь спеціальніпошукові службиабо сервіси. Їх традиційно поділяють на:

    • довідники чи каталоги
    • пошукові системи

    Ці різновиди візуально дуже схожі, оскільки«Кожен довідник має власну пошукову систему, а кожна пошукова система - власний довідник». Проте принципи їхньої роботи базуються на абсолютно різних підходах та технологіях. При цьому кожен різновид пошукових сервісів застосовується у вирішенні певного типу задач. Інформаційний пошук має на увазі використання певних стратегій, методів, механізмів та засобів. Поведінка користувача, здійснює управління процесом пошуку, визначається як інформаційної потребою, а й інструментальним розмаїттям системи - технологіями і засобами, наданими системою. Вибором інструменту багато в чому визначаєтьсястратегія пошукової діяльності та пошукові технології.

    Пошукові технології- уніфіковані (оптимізовані у межах конкретної інформаційно-пошукової системи) послідовності ефективного використання окремих засобів пошуку у процесі взаємодії користувача із системою.

    За використовуваними пошуковими технологіямиінформаційні системи можна розбити на 3 категорії:

    • тематичні каталоги та спеціалізовані каталоги (онлайнові довідники);
    • пошукові машини (повнотекстовий пошук);
    • засоби мета-пошуку.

    Тематичні каталогипередбачають опрацювання документів та віднесення їх до однієї з кількох категорій, перелік яких заздалегідь заданий. Фактично це знайоме всім бібліотекаряміндексування на основі класифікації. Спеціалізовані каталогиабо довідники створюються за окремими галузями та темами.Пошукові машини(найрозвиненіший засіб пошуку в Інтернеті) реалізують технологію повнотекстового пошуку. Індексуються тексти, розташовані на серверах, що запитуються.При використанні коштівметапошуку запит здійснюється одночасно кількома пошуковими системами. Результат пошуку об'єднується у загальний, упорядкований за рівнем релевантності, список.

    Засоби пошуку - взаємозалежний комплекс інформаційно-пошукових мов та мов визначення/управління даними, що забезпечує структурні та семантичні перетворення об'єктів обробки (документів, словників, сукупностей результатів пошуку).

    1. Довідники

    Пошукові засоби першої групи є електронні довідники, що мають чітку ієрархічну систематичну або логіко-тематичну структуру,багато в чому нагадує структуру систематичного каталогу бібліотеки. Робота з довідниками дозволяє орієнтуватися в Інтернет-ресурсах у межах окремих галузей знання, заглиблюючись від загального до приватного, змінюючи ієрархічні гілки, повертаючись на кілька кроків тому тощо.

    Серед російських розробок у цій галузі значаться:

    • Апорт (адреса: www.aport.ru),
    • List.ru (адреса: list.mail.ru ),
    • Weblist (адреса: www.weblist.ru ),
    • Іван Сусанін (адреса: www.susanin.net
    • Равлик (адреса: www.ulitka.ru).

    Головною відмінністю довідників є те, що вони зроблені вручну. Редакційні колегії кожного з довідниківза характером праці нагадують відділи каталогізації та систематизації великих бібліотек, регулярно переглядають вміст серверів, що знову з'явилися, і відстежують зміни на вже існуючих. Виявлені дані аналізуються та заносяться до розділів довідника відповідно до прийнятої класифікації. Опис сервера в цілому (або розділу, якщо він представляється цілком самостійним блоком) забезпечується короткою інструкцією, що містить загальні відомості про характер наявної інформації. У деяких випадках заносяться додаткові відомості про мову документів, відвідуваність ресурсу, його фізичне місцезнаходження тощо.

    Основними параметрами, що характеризують переваги довідників, є:

    • Об `єм;
    • оперативність відображення нових або ресурсів, що змінилися;
    • логічність та послідовність ієрархічної схеми класифікації;
    • перехресність структури.

    Обсягом довідника визначається ступінь його надійності чи «інформаційна міцність». У деяких системах існує спеціальний механізм, який періодично перевіряє доступність сайту і виключає його з переліку при довгому «відсутності» в Мережі. Логічністю (науковістю) застосовуваної схеми класифікації визначається міра простоти, з якою користувачі знаходять необхідні відомості. Системаперехресних посиланьдозволяє виявити інформацію, використовуючи різні підходи (наприклад, територіальний чи галузевий). У цьому випадку схема класифікації повинна автоматично виводити користувача на об'єкт, який шукає, який би шлях пошуку не був обраний.

    Можливості складання запиту цього виду пошукових засобів особливої ​​ролі не грають. Складні розшуки, які потребують деталізації запиту, за допомогою каталогів не проводяться.

    Довідники призначені для вирішеннятрьох типів завдань:

    • орієнтація у незнайомій галузі знання;
    • розшук великих об'єктів, якими є, наприклад, сервери організацій або значних проектів;
    • отримання готового переліку ресурсів, що мають розмитий пошуковий образ (бібліотек певного типу, транспортних розкладів або сайтів політичних партій тощо)

    Іншим прикладом є порівняння довідника ресурсів із систематичним каталогом бібліотеки, в якому від книги (в даному випадку цілого сайту) залишається лише опис та анотація.

    2. Пошукові системи

    В основу роботи пошукових систем (пошукових машин) закладено інші технологічні принципи. Завдання пошукових машин - забезпечити детальне розшук інформації, що може бути досягнуто тільки за рахунок обліку (індексування ) змісту максимально можливої ​​кількості веб-сторінок. На відміну від довідників, пошукові системи функціонують в автоматизованому режимі і мають однаковий принцип дії.

    Пошукові системи складаються із двох базових компонентів. Перший компонент єпрограму-робот , Завдання якого пересуватися з сервера на сервер і знаходити там нові (або змінилися) документи, завантажуючи їх на головний комп'ютер системи. Робот переглядає вміст документа, знаходить нові посилання - як на інші документи сервера, так і зовнішні сайти. Далі програма самостійно прямує за вказаними посиланнями, знаходить нові документи, після чого процес повторюється знову,нагадуючи добре відомий у бібліографії «метод сніжної грудки». Виявлені документи обробляються (індексуються) другим компонентом пошукової системи. При цьому зазвичай враховується весь зміст сторінки, включаючи текст, ілюстрації, аудіо- та відеофайли. Індексації піддаються усі слова в документі, що дає можливість використовувати пошукові системи для детального пошуку за вузькою тематикою. Утворенііндексні файли , що зберігають інформацію про те, яке ключове слово, скільки разів, у якому документі і на якому сервері використовується, становлять ту базу даних, до якої звертається бібліотекар, що вводить у рядок запиту поєднання ключових слів.

    Виведення результатів здійснюється за допомогою спеціального модуля, який виробляєінтелектуальне ранжування результатів . При цьому до уваги береться:

    • розташування терміна в документі (назва, заголовок, основний текст), частота його повторення,
    • відсоткове співвідношення шуканого терміну до тексту сторінки,
    • кількість та авторитетність зовнішніх посилань на цю сторінку з інших сайтів.

    До основним параметрам пошукових системвідносяться:

    • число проіндексованих серверів та окремих документів (обсяг індексних файлів);
    • ступінь оперативності оновлення бази даних за рахунок включення відомостей про нові матеріали та видалення застарілих;
    • можливості для складання запиту;
    • інтелектуальність системи ранжування результатів пошуку;
    • наявність додаткових сервісних функцій, що полегшують роботу користувача.

    Можливості пошукового механізму висловлювати запит максимально точно значною мірою визначають якість отриманих результатів. Кожна машина має власну лексику, яка по-різному дозволяє деталізуватипошукове розпорядження.

    Всі пошукові машини маютьмодулем ранжування результатів пошуку. Це другий базовий компонент усіх систем. Перелік факторів, що беруться до уваги при визначенні місця документа в переліку посилань, є надзвичайно широким: від розташування слова на сторінці до рейтингу (авторитету) сторінок, які мають посилання на знайдений документ.

    • Google (адреса: www.google.com ),
    • AlltheWeb (адреса: www.alltheweb.com ),
    • Alta Vista (адреса: www.altavista.com).

    Подібні пошукові засоби існують і в Росії. Всі вони призначені для роботи з російськомовними документами і мають потужний http://www.metabot.ru).

    Висновки на тему лекційного блоку

    Пошукова система робить вибірку сторінок з бази даних відповідно до запиту, потім сторінки впорядковуються за рівнем зменшення збігів (прим. А.А.)

    У разі спостерігається пряма аналогія з принципами роботи розподілених зведених каталогів бібліотеки. Ключовою можливістюмета-пошуку є здатність розсилати запити користувача одночасно з різних пошукових систем - з наступним підсумовуванням результатів. (Прим. А.А.)

    Звертаючись до довідників, бібліотекар може розраховувати на отримання лише дуже загальних відомостей на тематику, і ніколи - детальних даних: від сервера великої корпорації, що містить тисячі сторінок, у довіднику буде представлено лише найменування та кілька рядків інструкції.

    Класифікація пошукових інструментів (їх типи та види) Пошукові інструменти можна розділити на: - каталоги або директорії - directories - пошукові системи - search engines. В основі цієї класифікації покладено принцип відбору та обробки інформації для бази даних пошукового інструменту, а саме: наскільки цей процес автоматизований, хто створює базу даних пошукового інструменту: люди або комп'ютери.


    Класифікація пошукових інструментів (їх типи та види) Останнім часом різниця між пошуковими системами та директоріями «стирається», оскільки їх творці намагаються не акцентувати увагу користувачів на принципах відбору інформації, а представляють якомога більше схожих сервісних можливостей, працюючи як універсальні портали. Але різниця у відборі та обробці інформації все-таки залишається суттєво важливою та визначальною: – пошукові машини використовують машини-роботи для пошуку, індексації інформації – тобто. Процес повністю автоматизований; - директорії побудовані на тому, що сайт «чекається» бути прийнятим, обробленим та описаним спеціалістом-каталогизатором.


    Класифікація пошукових інструментів (їх типи та види) Такі відмінні один від одного принципи роботи пошукових систем та директорій значно впливають на їх обсяг та зміст, а відповідно – і на стратегію пошуку: Пошукові системи індексують вміст того чи іншого сайту повністю та пошук ведеться по всіх його повним текстам. Директорії представляють той чи інший сайт загалом – каталогізатор анотує та систематизує сайт відповідно до його загального змісту та повні тексти не індексуються. Пошукові системи індексують велику кількість сайтів, оскільки роботи, «що переглядають» вміст Мережі діють за принципом «снігової грудки», подорожуючи від посилання до посилання. Директорії ж відрізняються свідомістю та впорядкованістю підбору сайтів у свої бази даних (зазвичай це інформаційно насичені та/або сайти великих фізичних об'єктів).


    Класифікація пошукових інструментів (їх типи та види) Отже, деякі пошукові системи: Altavista (Яndex (Google (Rambler (FastSearch (


    Класифікація пошукових інструментів (їх типи та види) І директорії (або каталоги): Yahoo (Librarians Index to the Internet (lii.org) List.ru (


    Класифікація пошукових інструментів (їх типи та види) Серед перерахованих, як ви помітили, є як універсальні глобальні пошукові інструменти, так і універсальні регіональні (в даному випадку – російські). Наведемо і деякі інші: EuroFerret (Voila (Altavista France (fr.altavista.com)) UKPlus (ukplus.co.uk)


    Класифікація пошукових інструментів (їх типи та види) Поділ пошукових інструментів на глобальні та регіональні – не що інше, як класифікація за географічним принципом відбору ресурсів для індексації. Інші пошукові інструменти також змістовно організовують свої бази даних, але з тематики: FindLaw (Whowhere (MusicSearch (HumorSearch (FindBook (


    Класифікація пошукових інструментів (їх типи та види) Зауважте, що такі спеціалізовані або тематичні пошукові інструменти можуть використовувати: або власні бази даних для пошуку за вашим запитом, або проводять пошук по всій Мережі, використовуючи інші пошукові системи.


    Класифікація пошукових інструментів (їх типи та види) Крім того, існують і метапошукові системи, що пропонують шукати в декількох пошукових системах одночасно. Наприклад: Mamma (Перевага в тому, що в такому випадку видається максимально більша кількість результатів, а недолік у тому, що не всі пошукові системи мають однаковий синтаксис мови запитів (наприклад, лапки підтримуються не кожною пошуковою системою).


    Основні елементи мови запитів пошукових систем Перелічимо загальні елементи та особливості мови запитів пошукових систем: Більшість використовують: + або - (включити чи виключити термін із пошукового розпорядження); «лапки» (для позначення фрази, стійкого словосполучення). Деякі замість знаків + або використовують союзи AND, AND NOT.


    Основні елементи мови запитів пошукових систем Більшість дозволяють використовувати символи усічення слова зліва * (наприклад: wish* - будуть знайдені: wish, wishes, wishful, wishbone, and wishy-washy) Деякі пошукові системи чутливі до великих і малих літер (наприклад, якщо ви шукаєте матеріали про людей з прізвищем Stone за допомогою Altavista, слід обов'язково використовувати велику літеру, оскільки в іншому випадку будуть знайдені всі сайти, де зустрічається слово stone - камінь).


    Основні елементи мови запитів пошукових систем (на прикладі Яndex) ЕлементЩо він означаєПриклад запиту пробіл або & або + логічне І (у межах пропозиції) сімейне право &&логічне І (у межах документа) рецепти&& (плавлений сир) |логічне ІЛІфото | фотографія | знімок | фотозображення


    Основні елементи мови запитів пошукових систем (на прикладі Яndex) () групування слів(технологія | виготовлення) (масла | сиру) ~ або - союз І НЕ (у межах пропозиції) дума ~ закон ~~ союз І НЕ (у межах документа) путівник по парижу ~~ (агентство | тур) «» пошук фрази«антологія поезії»


    Основні елементи мови запитів пошукових систем (з прикладу Яndex) ! перед словомточна форма слова!реальний!моменту - Цей закон набирає чинності через два тижні з моменту його опублікування. $title («»)Вираження є у полі «Заголовок» (Title) HTML-документа. $title («флора та фауна») - сторінки з назвами схожими з «Флора та фауна Сибіру»


    І, на закінчення: 1) Для того, щоб правильно побудувати стратегію пошуку, потрібно перш за все вирішити для себе якусь інформацію ви хочете отримати - якусь загальну, що описує об'єкт або явище в цілому, або якісь деталі, зокрема, які можуть зустрітися у повному тексті якогось документа. У першому випадку – доцільно використати директорію, у другому – пошукову систему. 2) Якщо, починаючи пошук, ви ще не уявляєте точно, що і як багато ви хочете отримати в результатах запиту рекомендується використовувати різні пошукові інструменти в комплексі.