Увійти
Жіночий інформаційний портал
  • Підвищуємо безпеку максимально!
  • Який процесор кращий: AMD або Intel
  • Пам'ятка з використання мови запитів
  • У процесі реалізації інформаційного пошуку слід керуватися низкою загальних методичних рекомендацій
  • Пошук інформації може бути проведений за декількома методами, що значно розрізняються як за ефективністю та якістю пошуку, так і за типом видобутої інформації
  • Вибираємо тв антену для дачі
  • Пошукові інструменти. У процесі реалізації інформаційного пошуку слід керуватися низкою загальних методичних рекомендацій

    Пошукові інструменти.  У процесі реалізації інформаційного пошуку слід керуватися низкою загальних методичних рекомендацій

    ІПС (інформаційно-пошукова система)– це система, що забезпечує пошук та відбір необхідних даних у спеціальній базі з описами джерел інформації (індекс) на основі інформаційно-пошукової мови та відповідних правил пошуку.

    Релевантність– це відповідність результатів пошуку сформульованому запиту.

    Пертинентність(В інформаційному пошуку) - відповідність отриманої інформації інформаційної потреби користувача.

    Пертинентність вимірюється ступенем відповідності між очікуваннями користувача та результатами пошуку (порівняйте з релевантністю), яка визначається як відношення обсягу корисної для користувача інформації до загального обсягу отриманої інформації, знайденої пошуковою системою.

    Досягнення високого ступеня пертинентності – основне поле конкурентної боротьби сучасних пошукових систем. Саме для максимального задоволення інформаційних потребкористувачів в даний час в ІП-системах широко застосовуються теорії та методи семантичних мереж, контент-аналізу та глибинного аналізу текстів (Text mining, інтелектуальний аналіз текстів).

    Для пошуку потрібної інформації у мережі використовується адреса ресурсу (англ . UniformResourceLocator (URL) адресу),що містить ім'я протоколу, за яким потрібно звертатися до необхідної інформації, адресу сервера та ім'я файлу на цьому сервері (рис. 2).

    Рис. 2. Приклад адреси ресурсу

    Пошукова система- програмно-апаратний комплекс з веб-інтерфейсом, що надає можливість пошуку інформації в Інтернеті. Під пошуковою системою зазвичай мається на увазі сайт, на якому розміщений інтерфейс системи. Програмною частиною пошукової системи є пошукова машина (пошуковий двигун) - комплекс програм, що забезпечує функціональність пошукової системи і зазвичай є комерційною таємницею компанії-розробника пошукової системи

    Пошук інформації в Інтернеті здійснюється за допомогою спеціальних програм, що обробляють запити - інформаційно-пошукових систем (ІПС). Існує кілька моделей, на яких заснована робота пошукових систем, але історично дві моделі набули найбільшої популярності – це пошукові каталоги та пошукові покажчики.

    Пошукові каталоги влаштовані за тим самим принципом, як і тематичні каталоги великих бібліотек. Вони зазвичай є ієрархічні гіпертекстові меню з пунктами і підпунктами, що визначають тематику сайтів, адреси яких містяться в даному каталозі, з поступовим, від рівня до рівня, уточненням теми. Пошукові каталоги створюються вручну. Висококваліфіковані редактори особисто переглядають інформаційний простір WWW, відбирають те, що, на їхню думку, становить суспільний інтерес, і заносять до каталогу.

    Основною проблемою пошукових каталогів є надзвичайно низький коефіцієнт охоплення ресурсів WWW. Щоб багаторазово збільшити коефіцієнт охоплення ресурсів Web, із процесу наповнення бази даних пошукової системи необхідно виключити людський фактор - робота має бути автоматизована.

    Автоматичну каталогізацію Web-ресурсів та задоволення запитів клієнтів виконують пошукові вказівники. Роботу пошукового покажчика можна умовно поділити на три етапи:

      збирання первинної бази даних. Для сканування інформаційного простору WWW використовуються спеціальні агентські програми - черв'яки, завдання яких полягає у пошуку невідомих ресурсів та реєстрація їх у базі даних;

      індексація бази даних – первинна обробка з метою оптимізації пошуку. На етапі індексації створюються спеціалізовані документи – власне пошукові покажчики;

      рафінування результуючого списку. На цьому етапі створюється список посилань, який буде переданий користувачеві як результат. Рафінування результуючого списку полягає у фільтрації та ранжируванні результатів пошуку.

    Під фільтрацією розуміється відсівання посилань, які недоцільно видавати користувачеві (наприклад, перевіряється наявність дублікатів). Ранжування полягає у створенні спеціального порядку подання результуючого списку (за кількістю ключових слів, супутніх слів та ін.).

    Головним завданням будь-якої ІПС є пошук інформації релевантної до інформаційних потреб користувача. Дуже важливо в результаті проведеного пошуку нічого не втратити, тобто знайти всі документи, що належать до запиту, і не знайти нічого зайвого. Тому запроваджується якісна характеристика процедури пошуку – релевантність.

    Релевантність– це відповідність результатів пошуку сформульованому запиту.

    1 Пошукові інструменти

    Пошукові інструменти – це особливе програмне забезпечення, основна мета якого – забезпечити найбільш оптимальний та якісний пошук інформації для користувачів Інтернету. Пошукові інструменти розміщуються на спеціальних веб-серверах, кожен з яких виконує певну функцію:

    Машини веб-пошуку - це сервери з величезною базою даних URL-адрес, які автоматично звертаються до сторінок WWW на всі ці адреси, вивчають вміст цих сторінок, формують і прописують ключові слова зі сторінок у свою базу даних (індексує сторінки).

    Більше того, роботи пошукових систем переходять за посиланнями, що зустрічаються на сторінках, і переіндексують їх. Так як майже будь-яка сторінка WWW має безліч посилань на інші сторінки, то при подібній роботі пошукова машина зрештою теоретично може обійти всі сайти в Інтернет.

    Саме цей вид пошукових інструментів є найбільш відомим та популярним серед усіх користувачів мережі Інтернет. Кожен на слуху назви відомих машин веб-пошуку (пошукових систем) – Яndex, Rambler, Aport.

    Робота машин веб-пошуку зводиться до наступного:

      Аналіз веб-сторінок та занесення результатів аналізу на той чи інший рівень бази даних пошукового сервера.

      Пошук інформації на запит користувача.

      Забезпечення зручного інтерфейсу для пошуку інформації та перегляду результату пошуку користувачем.

    Прийоми роботи, які використовуються під час роботи з тими чи іншими пошуковими інструментами, практично однакові. При їх описі застосовуються такі поняття:

      Інтерфейс пошукового інструменту представлений у вигляді сторінки з гіперпосиланнями, рядком подання запиту (рядком пошуку) та інструментами активізації запиту.

      Індекс пошукової системи – це інформаційна база, що містить результат аналізу веб-сторінок, складена за певними правилами.

      Запит – це ключове слово або фраза, яку користувач вводить у рядок пошуку. Для формування різних запитів використовують спеціальні символи ("", ~), математичні символи (*, +, ?).

    Схема пошуку інформації проста. Користувач набирає ключову фразу та активізує пошук, тим самим отримує добірку документів за сформульованим (заданим) запитом. Цей список документів ранжується за певними критеріями так, щоб зверху списку опинилися ті документи, які найбільше відповідають запиту користувача. Кожен із пошукових інструментів використовує різні критерії ранжирування документів, як під час аналізу результатів пошуку, і під час формування індексу (наповнення індексної бази даних web-страниц).

    У Росії найбільшими та популярними пошуковими покажчиками є:

      Яндекс (www.yandex.ru)

      "Рамблер" (www.rambler.ru)

      "Google" (www.google.ru)

      "Апорт2000" (www.aport.ru)

    2 Механізми пошуку

    Узагальнена технологія пошуку складається з наступних етапів:

      Користувач формулює запит

      Система проводить пошук документів (або їх пошукових образів)

      Користувач отримує результат (відомості про документи)

      Користувач удосконалює чи реформує запит

      Організація нового пошуку...

    Як правило, пошукові машини підтримують два режими: режим простого пошуку та режим розширеного пошуку. Розглянемо узагальнені можливості.

    Формування запиту як простого пошуку.Можна просто вводити через пробіл одне або кілька слів; пошук слів із різними закінченнями моделюється символом * в кінці слова. Багато систем дозволяють шукати словосполучення або фразу, для цього необхідно її укласти в лапки. Можливе обов'язкове включення або виключення певних слів.

    Основна проблема пошуку примітивно складеного запиту (у вигляді перерахування ключових слів) полягає в тому, що пошукова машина знайде всі сторінки, на яких зазначені слова зустрічаються в будь-якій частині документа. Як правило, кількість знайдених сторінок буде надто великою.

    Для покращення якості пошуку в режимі простого пошуку можна використовувати логічні оператори та оператори, які дозволяють обмежити область пошуку, а також вибір певної категорії документів з представленого списку.

    Багато пошукових систем включають до своєї мови складання запитів спеціальні оператори, що дозволяють проводити пошук у певних зонах документа, наприклад, у його заголовку, або шукати документ за відомою частиною його адреси.

    Режим розширеного або детального запитуу різних системах реалізований індивідуально, але найчастіше це бланк, у якому згадані оператори та ключові елементи реалізуються простою установкою відповідних прапорців або вибором параметрів зі списку.

    Нижче приклад наведено відомості з розділу допомогапошукової системи Yandex: вікно розширеного пошуку, мову запитів, шукати у знайденому.

    Шукати в знайденомуЯкщо вв результаті запиту Яндекс знайшовбагато документів, але на більш широку тему, ніж вам хочеться, ви можете скоротити цей список, уточнивши запит. Ще один варіант - увімкнути прапорець в знайденому вформі пошуку, задати додаткові ключові слова, і наступний пошук вестиметься тільки за тими документами, які були відібрані впопередній пошук.

    Пам'ятка з використання мови запитів

    Приклад

    Значення

    "До нас на ранковий розсіл"

    Слова йдуть поспіль у точній формі

    "Прибув * посол"

    Пропущено слово у цитаті

    півгорбушки & мосол

    Слова в межах однієї речення

    споряджуйся && дістань

    Слова в межах одного документа

    глухаря | куріпку | когось

    Пошук будь-якого зі слів

    не зможеш<< винить

    Неранжуюче "і": вираз після оператора не впливає на позицію документа у видачі

    я должон /2 стратити

    Відстань у межах двох слів у будь-який бік (тобто між заданими словами може зустрічатися одне слово)

    щось я ~~ зрозумію

    Виняток слова зрозуміюз пошуку

    при моєму / +2 розуму

    Відстань у межах двох слів у прямому порядку

    чай ~ лаптем

    Пошук пропозиції, де слово чайзустрічається без слова лаптем

    щи / (-1 +2) сьорбаю

    Відстань від одного слова у зворотному порядку до двох слів у прямому

    Думаю! що!

    Слова у точній формі із заданим регістром

    виходить && (+на | !Мені)

    Дужки формують групи у складних запитах

    Політика

    Словникова форма слова

    title:(в країні)

    Пошук за заголовками документів

    url:ptici.narod.ru/ptici/kuropatka.htm

    Пошук по URL

    неодмінно inurl:vojne

    Пошук з урахуванням фрагмента URL

    Пошук по хосту

    Пошук по хосту у зворотному записі

    site:http://www.lib.ru/PXESY/FILATOW

    Пошук по всіх піддоменах та сторінках заданого сайту

    Пошук по одному типу файлів

    Пошук з обмеженням з мови

    Пошук з обмеженням по домену

    Пошук з обмеженням за датою

    державна справа && /3 вловлюєш нитку

    Відстань у 3 пропозиції в будь-який бік

    щось я ~~ зрозумію

    Виняток слова зрозуміюз пошуку

    Цікавою можливістю є пошук документів у мережі, що посилаються на сторінку із зазначеною вами адресою (URL). Таким чином, можна знайти в мережі сторінки, на яких є посилання на ваш веб-сайт. Деякі системи дозволять обмежити область пошуку всередині вказаного домену.

    Як додаткові спеціальні оператори можна виділити:

      Оператори пошуку документів із певним графічним файлом;

      Оператори обмеження за датою сторінок;

      Оператори близькості між словами;

      Оператори обліку словоформ;

      Оператори сортування результатів (за релевантністю, свіжістю, старості).

    Слід зазначити, що, на превеликий жаль, на сьогоднішній день не існує стандарту на кількість і синтаксис операторів, що підтримуються, для різних пошукових систем. Спроби розробити стандарт на синтаксис операторів, що підтримуються, тому є надія на те, що розробники пошукових систем подбають про зручність користувачів. На даному етапі розвитку засобів пошуку, користувач, звертаючись до певної пошукової системи, неодмінно повинен насамперед ознайомитись з її правилами складання запитів. Як правило, на домашній сторінці буде обов'язково бути посилання Допомога (Help),за якою ви перейдете до довідкової інформації.

    Різні пошукові системи описують різні джерела інформації в Інтернет. Тому не можна обмежуватися пошуком лише в одній пошуковій системі.

    Розглянемо способи представлення результатів пошуку у пошукових машинах.

    Найчастіше кількість знайдених документів перевищує кілька десятків, а окремих випадках може досягати сотень тисяч! Тому як форма видачі складається список документів по 5-10-15 одиниць на сторінці з можливістю переходу до наступної порції внизу сторінки. Обов'язково вказується заголовок та URL(адреса) знайденого документа, іноді система вказує у відсотках ступінь релевантності документа.

    В описі документа найчастіше міститься кілька перших речень або витримки з тексту документа з виділенням ключових слів. Як правило, вказано дату оновлення (перевірки) документа, його розмір у кілобайтах, деякі системи визначають мову документа та його кодування (для російськомовних документів).

    Що можна робити із отриманими результатами? Якщо назва та опис документа відповідають вашим вимогам, можна негайно перейти до його першоджерела за посиланням. Це зручніше робити у новому вікні, щоб мати можливість далі аналізувати результати видачі. Багато пошукових систем дозволяють проводити пошук у знайдених документах, причому ви можете уточнити ваш запит запровадженням додаткових термінів.

    Якщо інтелектуальність системи є високою, вам можуть запропонувати послугу пошуку схожих документів. Для цього ви вибираєте документ, що особливо сподобався, і вказуєте його системі як зразок для наслідування.

    Однак, автоматизація визначення схожості – дуже нетривіальне завдання, і найчастіше ця функція працює неадекватно вашим надіям. Деякі пошукові системи дозволяють провести пересортування результатів. Для збереження вашого часу можна зберегти результати пошуку у вигляді файлу на локальному диску для подальшого вивчення в автономному режимі.

    Сервісів для організації процесу роботи у команді сьогодні стільки, що за місяць не розібратися. Якщо випробовувати всі популярні та підходящі інструменти, на цій піде багато часу, якого і так не вистачає, особливо в умовах запуску стартапу.

    Це до геніальності найпростіший інструмент, створений для управління завданнями. Потрібно зовсім небагато часу, щоб почати його використовувати. Вся наша команда без проблем опанувала його.

    Найприємніше – він безкоштовний!

    Для організації ми використовуємо методологію scrum:

    • у нас тижневі спринти;
    • щосуботи підбиття підсумків та планування наступного етапу;
    • релізи запускаються за готовністю.
    Декілька наших бордів:

    • Борд «HADI» (Hypothesis, Action, Data, Insights)
    • Це цікава методологія. На початку тижня ми ставимо гіпотези, які стосуються певних метриків. Протягом тижня ці гіпотези перевіряються, аналізуються. У результаті робимо висновок: гіпотеза вірна чи ні? Щоб розпочати роботу над завданням, перекидаємо її в інший борд (продукт, просування та ін.).
    • Борд "Продукт"
    • Ділимо дошку на листи: завдання на тиждень, у процесі, зроблено за тиждень, баги, зроблено за місяць та ін.
    • Борд "Просування".
    • Тут представлений наочний план просування проекту. За часом, каналами, цілями тощо.
    • Та ін.
    На Цукерберг зателефонує ми публікували статтю «Як організувати роботу над SaaS-проектом в Trello». Обов'язково почитайте, ми там розгорнуто описали свій підхід для керування завданнями та метриками. І те, як ми його продали за допомогою Trello.

    Нижче зображений борд «HADI». Як бачите, кожній метриці, яку впливає завдання, відповідає свій колір. Це зроблено для того, щоб при перенесенні завдання до інших бордів, зберігалося розуміння того, яку метрику ми хочемо покращити.

    А ось так виглядає борд "Продукт". Сюди завдання потрапляють із борду «HADI», і кожна з них виділена певним кольором. Ми бачимо, на яку метрику це завдання вплине. Відповідно, перевіряти гіпотези та аналізувати ефект від змін стає набагато простіше.

    Здорово, що як тільки у нас щось змінюється в процесі - вигадуємо нові фішки управління, або розуміємо, що щось не "досконало" - ми відразу змінюємо це в трелло і починаємо використовувати. Ціна змін – 3,5 секунди.

    2. RealtimeBoard – керуємо змінами в інтерфейсі
    У онлайн-сервісах інтерфейс – одна з основних складових продукту. Робота над дизайном постійно вирує. Будь-яка зміна або планування змін має обговорюватися всією командою. Як-не-як, у стартапі думка кожного гравця в команді на вагу золота.

    Дизайнер бачить завдання з погляду дизайну (як краще виділити ключові елементи, розставити акценти і т.д.), product owner з погляду клієнта (що важливо для користувача, які елементи забуті чи що зайве), розробник з погляду технологій (не усі фантазії дизайнера можна реалізувати за короткий відрізок часу).

    Якщо з обмірковуванням ідей та завдань все просто, то як обговорювати сам дизайн? Як це зазвичай буває: «Он та штука справа внизу, потрібно зробити її трохи правіше і колір обведення зробити зеленішим». Яка штука, яке обведення, що означає зеленіше? Нас це не влаштовувало. Дизайн потрібно обговорювати візуально - тобто малювати, черкатися, бачити попередні ітерації.

    Рішення повинні прийматись швидко, тому часу на спеціальні зустрічі та обговорення немає.
    Ми використовуємо сервіс RealtimeBoard. Обговорюємо весь дизайн у ньому. Сервіс для цього підходить ідеально. В одному місці можна тримати версії всіх сторінок, концепції, коментарі.

    Ось приклад того, як ми обговорювали процес розробки картки користувача:

    Кожен коментар має свій колір:

    • жовтий – просто обговорення, питання, пояснення;
    • червоне - потрібна зміна в даному місці;
    • зелене - вирішене питання (зазвичай червоне перетворюється на зелене).
    Ось приклад опису сценаріїв життя користувача.

    Ми спільно будували цикл життя користувача та визначали коли якісь листи та повідомлення надсилати.

    3. Carrot Quest - розуміємо користувачів та спілкуємося з ними
    Може й не скромно говорити про власний сервіс, але він ідеально підходить для нас. У ньому ми організуємо всю аналітику та спілкуємося з користувачами (здійснюємо підтримку, робимо маркетинг, повертаємо користувачів).

    Отже, користувач реєструвався. Зрозуміло ми відразу автоматично відправляємо листа з подякою за реєстрацію та інструкціями (як, куди встановити код на сайт і т.п.).

    Якщо ми знаємо, скільки часу пройшло з моменту реєстрації, то можемо припустити, яка інформація зараз актуальна для користувача та за рахунок чого залучити його далі.

    Ми розбиваємо користувачів, що зареєструвалися, на сегменти за часом їх реєстрації в сервісі, щоб допомагати їм на всіх етапах тріалу (тестового періоду) і залучати в подальшу роботу.

    Приклад:

    • Пройшло 2 дні тріалу – ми встигаємо проаналізувати сайт користувача та визначити, чим ми можемо допомогти;
    • Пройшло 3-7 днів – пропонуємо низку інструкцій та кейсів, які докладно розповідають про кожен інструмент (як налаштувати та ефективно використовувати);
    • Пройшло 7-12 днів – щодня надсилаємо статистику, яку ми зібрали за допомогою Carrot Quest (приклад показано нижче);
    • Пройшло 12 днів – ми нагадуємо, що до кінця тріалу періоду залишилося 2 дні, і щоб продовжити роботу, необхідно сплатити. Перекладаємо клієнта на сторінку із тарифними планами.
    У сервісі ми дивимося докладну статистику за розсилками (скільки відправлено за період, %, що прочитали, % відповіли і т.д.). Ще важливо, що ми знаємо, які саме користувачі вчинили дії у листі. Так ми вибираємо тих, хто листа прочитав і якщо вони не відповіли, то цікавимося: "що пішло не так?"

    Ось приклад автоматичного вітального листа, який ми надсилаємо одразу після реєстрації.

    А ось приклад листа зі статистикою про користувачів підключеного сайту:

    Про процес аналізу дій користувачів, підтримку та активацію ми напишемо у наступних статтях.

    4. Slack – спілкуємось у команді

    Стандартні месенджери зазвичай відволікають від роботи та дезорганізують команду (skype, vk). Відмовитись від них ми не можемо, але вважаємо, що для робочого спілкування потрібен спеціальний сервіс, в якому немає зовнішніх подразників (друзів, знайомих, родичів). Тому ми використовуємо Slack. Він чудово підходить для комунікації всередині команди. У ньому є все потрібне.

    У Slack ми ділимо розмови каналами, т.к. потік інформації у команді дуже високий. Якщо все тримати в одному місці, нічого хорошого це не приведе. Ось наші канали:

    • General (обговорюємо всі основні моменти щодо проекту);
    • Design (обговорюємо дизайн);
    • Read-me (ділимося корисним контентом: статтями, відео, презентаціями);
    • Bugs (власне, тут обговорюємо баги);
    • Ideas (збираємо та обговорюємо всілякі ідеї, як наші, так і наших клієнтів);
    • І ще кілька інших каналів. Про двох із них я розповім трохи докладніше.

    Канал "Task"
    Ми настроїли інтеграцію Trello з Slack. Тепер ми в режимі реального часу бачимо, які зміни відбулися у Треллі. Це допомагає оперативно реагувати та розуміти, на якому етапі роботи ми зараз перебуваємо.

    Інтеграція різних сервісів зі Slack – штука дуже класна, дозволяє контролювати процеси в одному місці, не жертвуючи контекстом та часом.

    Канал "Notifications"

    Ми об'єднали Carrot quest з Slack. Тепер ми отримуємо повідомлення, якщо користувач здійснив низку дій. Можна вибирати ті дії, про здійснення яких вам важливо знати та отримувати своєчасне повідомлення.

    Наприклад, одна з дій, яку ми самі моніторимо, – це кроки реєстрації. Як тільки користувач почав реєструватися, ми миттєво отримуємо повідомлення, що за сайт він підключив. І якщо є час, із повідомлення в slack переходимо на картку користувача і через чат допомагаємо користувачеві налаштувати сервіс.

    Ці 4 сервіси допомагають нам ефективно вибудовувати роботу та покращувати свій продукт. Ми постійно пробуємо щось нове та постараємось ділитися своїм досвідом.

    Цікаво буде дізнатися, як ви працюєте з подібними сервісами і які рішення використовуєте для завдань подібного типу.

    Працюйте ефективно!

    Розміщення інформаційних ресурсів.

    Кошти пошуку інформаційних ресурсів.

    Нині зростання інформаційних ресурсів Інтернету відбувається високими темпами. Всесвітня мережа нагадує читальний зал бібліотеки, де зберігаються гігантські обсяги текстових, графічних, мультимедійних, архівних та інших файлів. Цей зал неможливо оминути повністю. Тут все щогодини змінюється, тіло різноманітних документів зростає кожну секунду. Знайти необхідну інформацію стає дедалі важче. Різні друковані довідники старіють ще до їхнього виходу у світ. Єдиним надійним способом пошуку інформації є використання спеціальних пошукових систем, які постійно відслідковують зміни в мережі.

    Ресурси, що використовуються в мережі Інтернет, найчастіше розміщуються на сторінках WWW-серверів (або Web-серверів), у файлових архівах (FTP-архівах) та в інформаційно-довідковій системі Gopher.

    WWW (World Wide Web – Всесвітня Павутина) – це глобальна гіпертекстова система, що використовує для транспортування інформації в мережі Інтернет протокол HTTP (HyperText Transfer protocol – протокол передачі гіпертексту). Гіпертекст - це спосіб представлення всіх типів інформації у вигляді послідовності вузлів, пов'язаних один з одним асоціативним (а не послідовним) зв'язком і реалізованим у вигляді гіперпосилань. Гіперпосилання - виділена в гіпертексті послідовність символів, що реагує на клацання миші та відсилає користувача на інший фрагмент гіпертексту. Більшість документів, що зберігаються на Web-сервері, створено мовою HTML (HyperText Markup Language – мова гіпертекстової розмітки документів).

    Gopher-сервер - це сервер, що містить програми, що дозволяють знайти файли, програми або інші ресурси на задану тему користувача. URL-адреса такого сервера виглядає так (якщо сервер, наприклад, належить фірмі Microsoft): gopher://gopher.microsoft.com.

    Виділяють дві групи пошукових інструментів: 1) пошукові системи та 2) пошукові служби.

    ІПС (інформаційно-пошукова система) -це система, що забезпечує пошук та відбір необхідних даних у спеціальній базі з описами джерел інформації ( індексі ) на основі інформаційно-пошукової мови та відповідних правил пошуку.

    В Internet можна виділити такі пошукові інструменти для WWW: пошукові системи, метапошукові системи (пошукові служби) та програми прискореного пошуку (пошукові агенти).


    Рис.13. Засоби пошуку у WWW

    Залежно від того, хто створює бази даних, у яких здійснюється пошук необхідної користувачеві інформації, розрізняють пошукові системипершого та другого роду. У пошукових системах першого роду бази даних створюються людьми, у пошукових системах другого роду цей процес здійснює комп'ютер.


    Пошукові системи першого роду, як правило, називають каталогами (предметними чи тематичними - subject catalogs).Зазвичай такі каталоги створюються людьми як ієрархічних дерев, на верхньому рівні яких стоять найбільш загальні поняття: бізнес, політика, освіта, спорт, культура тощо. Елементами нижнього рівня таких дерев є посилання на конкретні веб-сторінки та сервери. Зазвичай пошук у предметних каталогах здійснюється за ключовими словами . У цьому випадку він проводиться не у вмісті Web-серверів, а в їх коротких описах, що зберігаються в каталозі. Запит на пошук формується або через список ключових слів («information technology», «computer linguisics» тощо) або шляхом вказівки URL-адрес документів, в яких слід проводити пошук. Результати пошуку подаються у вигляді гіпертексту, що містить як гіпертекстові посилання назви або URL-адреси знайдених документів.

    За ключовими словами можна здійснювати пошук наступної інформації:

    1) деякого тексту чи його частини;

    2) фактичні дані (наприклад, масу сонця або ім'я президента країни);

    3) картин, малюнків, кінофільмів тощо. за їх назвами;

    4) технічної інформації (наприклад, відомості про швидкість якогось автомобіля);

    5) біографій людей (письменників, художників тощо).

    Прикладами тематичних каталогів є Yahoo, Galaxy, WWW Virtual Library, WebCrawler, HotBot та ін. Подібна російськомовна система називається «Слідопит».

    Пошукові системи другого роду іноді називають автоматичними індексами, «павуками» або «хробаками» spiders, crawlers).Вони постійно сканують Інтернет, знаходять у мережі нові документи і з кожного документа витягують усі гіперпосилання, що містяться в ньому, якими поповнюють свої бази даних (бази URL-адрес). Щоб можна було виконувати ці функції, автоматичний індекс включає наступні три частини: програму-робота, яка постійно переглядає Інтернет; базу даних (множина URL-адрес), яка збирається роботом, та інтерфейс користувача для пошуку необхідної інформації в цій базі даних. Існує велика кількість автоматичних індексів. Найбільш популярними є:

    Закордонні пошукові машини:

    - Altavista (http://www.altavista.com);

    - Go (Infoseek) (http://www.go.com);

    - Google (http://www.google.com);

    - Excite (http://www.excite.com);

    - HotBot (http://www.hotbot.com);

    - Nothern Light (http://www.northernlight.com).

    Російські пошукові машини:

    - Яndex (http://www.yandex.ru);

    - Рамблер (http://www.rambler.ru);

    - Апорт (http://www.aport.ru).
    Популярні білоруські пошукові системи:

    - Система ALL.BY (http://all.by);

    - Система *.BY (http://search.promedia.minsk.by);

    - реєстр білоруських WWW-ресурсів Зубр (http://www.zubr.com);

    - Білоруський інтернет-каталог Акавiта (http://akavita.kryvia.net);

    - Білоруські ресурси каталог (http://www.belresource.com.by),

    Більшість пошукових систем є одним із компонентів функціональних Web-сайтів Internet – так званих порталів.

    Портал- багатофункціональний Web-вузол Internet, що пропонує різноманітні послуги: пошук інформації, безкоштовна електронна пошта тощо.

    Останнім часом у всесвітній мережі стали з'являтися системи, що автоматично здійснюють пошук відразу в двох індексах (індексі каталогу та індексі пошукової машини). Подібні системи дозволяють використовувати переваги пошукових серверів обох типів та називаються каталогами-машинами.

    Пошук інформації за допомогою різних пошукових інструментів може здійснюватися шляхом формування простих та складних запитів. Простий запит є словом або словосполученням, яке іноді береться в лапки. Складний запит формується зі слів або словосполучень, що з'єднуються операторами типу AND, OR, NOT, NEAR або математичними символами, наприклад "*", "+", "-", "~". Іноді для тих самих цілей використовуються спеціальні терміни domain, host, link tideта ін.

    Технології пошуку

    Закони тертя та тепломасообміну в турбулентному прикордонному шарі

    Існує кілька різновидів уявлення «закону тертя» (для еталонного випадку), що призводять практично до тотожних результатів. Відповідно до поняття «логарифмічного» прикордонного шару (при значенні першої константи турбулентності χ = 0,4) закон тертя для гранично розвиненої турбулентності з «зникаючою в'язкістю» добре апроксимується простою формулою Кишені:

    При степеневому поданні профілю швидкості повинна бути запропонована формула:

    де: ; n– статечний показник профілю швидкості;

    - Напівемпіричний коефіцієнт;

    А- Емпіричний коефіцієнт;

    δ - Товщина прикордонного шару.

    Використовуючи співвідношення для чисел Рейнольдса, побудованих на різних лінійних величинах:

    Важливо зазначити, що для випадку розвитку турбулентного прикордонного шару з передньої кромки ( х кр = 0) закон тертя має бути представлений також у вигляді:

    Значення параметричних величин представлених формул для різних профілів швидкостей зведені до таблиці

    Параметр n
    1/7 1/8 1/9 1/10
    А 8,74 9,71 10,6 11,5
    0,0975 0,089 0,0818 0,0757
    1,28 1,25 1,22 1,20
    m 0,250 0,222 0,200 0,182
    B 0,0252 0,0206 0,0190 0,0148
    m 1 0,200 0,182 0,167 0,154
    B 1 0,0576 0,0450 0,0362 0,0308

    Відомі і використовуються також інші форми подання закону тертя, що призводять практично до одних і тих самих результатів. Так, В.М. Євлевим запропоновано апроксимацію:

    Формули для законів тепло- і масообміну виходять з «законів тертя» для стандартних умов (еталонний випадок) за допомогою відомого принципу потрійної аналогії Рейнольдса.

    де: S– коригуючий множник – фактор аналогії Рейнольдса на не дотримання умов еталона (і), фактор Sу першому наближенні задовільно апроксимується співвідношенням:

    Важливо зазначити, що для випадку використання інтегральних параметрів «закони» тепло- та масообміну добре описуються залежностями:

    Web-технологія World Wide Web (WWW) вважається спеціальною технологією підготовки та розміщення документів у мережі Інтернет. До складу WWW входять і web-сторінки, і електронні бібліотеки, каталоги та навіть віртуальні музеї! При такій різноманітності інформації гостро постає питання: «Як зорієнтуватися в такому величезному і масштабному інформаційному просторі» У вирішенні цієї проблеми на допомогу приходять пошукові інструменти.

    Пошукові інструменти - це особливе програмне забезпечення, основна мета якого - забезпечити найбільш оптимальний та якісний пошук інформації для користувачів Інтернету. Пошукові інструменти розміщуються на спеціальних веб-серверах, кожен з яких виконує певну функцію:

    1. Аналіз веб-сторінок та занесення результатів аналізу на той чи інший рівень бази даних пошукового сервера.

    2. Пошук інформації на запит користувача.

    3. Забезпечення зручного інтерфейсу для пошуку інформації та перегляду результату пошуку користувачем.

    Прийоми роботи, які використовуються під час роботи з тими чи іншими пошуковими інструментами, практично однакові. Перед тим як перейти до їх обговорення, розглянемо такі поняття:

    1. Інтерфейс пошукового інструменту представлений у вигляді сторінки з гіперпосиланнями, рядком подання запиту (рядком пошуку) та інструментами активізації запиту.

    2. Індекс пошукової системи - це інформаційна база, що містить результат аналізу веб-сторінок, складена за певними правилами.

    3. Запит - це ключове слово або фраза, яку вводить користувач у рядок пошуку. Для формування різних запитів використовують спеціальні символи ("", ~), математичні символи (*, +, -).

    Схема пошуку інформації проста. Користувач набирає ключову фразу та активізує пошук, тим самим отримує добірку документів за сформульованим (заданим) запитом. Цей перелік документів ранжується за певними критеріями те щоб вгорі списку опинилися ті документи, які найбільше відповідають запиту користувача. Кожен із пошукових інструментів використовує різні критерії ранжирування документів, як під час аналізу результатів пошуку, і під час формування індексу (наповнення індексної бази даних web-страниц).

    Якщо вказати в рядку пошуку для кожного пошукового інструменту однакової конструкції запит, можна отримати різні результати пошуку. Для користувача має велике значення, які документи виявляться у перших двох-трьох десятках документів за результатами пошуку та наскільки ці документи відповідають очікуванням користувача.

    Більшість пошукових інструментів пропонують два способи пошуку. simple search(простий пошук) та advanced search(розширений пошук) з використанням спеціальної форми запиту та без неї. Розглянемо обидва види пошуку на прикладі англомовної пошукової машини.

    Наприклад, AltaVista зручно використовувати для довільних запитів, «Something about online degrees in information technology», тоді як пошуковий інструмент Yahoo дозволяє отримувати світові новини, інформацію про курс валют або прогноз погоди.

    Освоєння критеріїв уточнення запиту та прийомів розширеного пошуку, дозволяє збільшувати ефективність пошуку та досить швидко знайти необхідну інформацію. Перш за все, збільшити ефективність пошуку Ви можете за рахунок використання в запитах логічних операторів (операцій) Or, And, Near, Not, математичних та спеціальних символів. За допомогою операторів та/або символів користувач пов'язує ключові слова у потрібній послідовності, щоб отримати найбільш адекватний запит результат пошуку. Простий запит дає необхідну кількість посилань на документи, т.к. до списку потрапляють документи, що містять одне зі слів, введених при запиті, або просте словосполучення (див. таблицю 1). Оператор and дозволяє вказати на те, що у змісті документа повинні бути включені всі ключові слова. Тим не менш, кількість документів має бути все ще великою, і їх перегляд займе достатньо часу. Тому в ряді випадків набагато зручніше застосувати контекстний оператор near, що вказує, що слова повинні розташовуватися в документі в достатній близькості. Використання близько зменшує кількість знайдених документів. Наявність символу "*" у рядку запиту означає, що здійснюватиметься пошук слова за його маскою. Наприклад, отримаємо список документів, що містять слова, що починаються на gov, якщо в рядку запиту запишемо gov *. Це бувають слова government, governor тощо.

    Найбільш розвинений сервіс пошуку російськомовної інформації надає пошуковий сервер Яndex. В Яndex можна просто написати російською фразу, що описує те, що Ви хочете знайти, і система проаналізує та опрацює Ваш запит, а потім постарається знайти все, що відноситься до заданої теми. Ви можете, використовуючи спеціальні оператори, скласти рядок, що пояснює пошуковій системі, яким Вашим вимогам повинна відповідати інформація, що Вас цікавить. Деякі з операторів мови запитів Яndex можна переглянути тут: http://help.yandex.ru/search/ -id=481939

    Не менш популярна пошукова система Rambler веде статистику відвідуваності посилань з власної бази даних, підтримуються ті ж логічні оператори. зменшення значимості слів, що вводяться в запит.

    Давайте розглянемо найпопулярніші технології пошуку інформації в Інтернеті.

    Тема 3 Робота з пошуковими системами Інтернет