Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
модуль.docx
Скачиваний:
350
Добавлен:
05.03.2016
Размер:
2.15 Mб
Скачать

1.2.8. Пошук ланцюжків у тексті

Згідно з даними офіційної статистики близько 85% користувачів Інтернет постійно звертаються до пошукових систем (Google, Yandex, Rambler, Yahoo!, Апорт, Пошук@Mail.ru, тощо) з метою пошуку необхідної їм інформації про товари або послуги.

Положення теорії автоматів підходять для описування таких реальних завдань, що виникають у програмних продуктах, як пошук у мережі Internet та видобування інформації з тексту. Багато сучасних пошукових систем Інтернету використовують спеціальну програму – пошуковий робот, який є автоматом.

У століття Інтернету та електронних бібліотек із безперервним доступом звичайною є проблема – задано деяку множини слів та необхідно знайти усі документи, в яких міститься одне чи усі з цих слів. Популярним прикладом такого процесу служить робота пошукової машини, яка використовує спеціальну технологію пошуку, що називається оберненими індексами (inverted indexes). Для кожного слова, що зустрічається в Internet (а їх близько 100000000), зберігається список адрес усіх місць, де воно зустрічається. Машини з дуже великим об’ємом оперативної пам’яті забезпечують постійний доступ до найбільш релевантних з цих списків, даючи змогу багатьом людям здійснювати пошук документів. У методі обернених індексів скінченні автомати не використовуються, але цей метод вимагає значних витрат часу для копіювання вмісту мережі та переписування індексів. Існує багато суміжних програмних продуктів, в яких застосовувати техніку обернених індексів не можна, однак можна з успіхом використовувати методи на основі автоматів. Ті застосування, для яких підходить технологія пошуку на основі автоматів, мають такі особливості:

1) вміст сховища тексту, в якому здійснюється пошук, швидко змінюється;

2) документи, пошук яких здійснюється, не можуть бути каталогізовані.

Висновки

  1. Теорія цифрових автоматів – це розділ теорії систем керування, що вивчає математичні моделі перетворювачів дискретної інформації, які називаються автоматами. Такими перетворювачами є як реальні пристрої, так й абстрактні системи.

  2. Теорія автоматів пов’язана з теорією інформації та теорією алгоритмів.

  3. Теорія автоматів використовується у виробництві цифрових систем і програмуванні (побудові трансляторів, у штучному інтелекті тощо).

Контрольні запитання

  1. Дайте означення автомату.

  2. Наведіть задачі, які вивчає теорія цифрових автоматів. З яких основних частин вона складається?

  3. Наведіть основні означення понять теорії інформації – «інформація», «повідомлення», «знак», «символ», «сигнал».

  4. Яка операція опрацювання інформації називається кодуванням та декодуванням?

  5. Наведіть класифікацію цифрових автоматів.

  6. Охарактеризуйте застосування теорії автоматів для програмування та у виробництві цифрової техніки.

2. Інформаційні основи комп’ютерів

  • Компютер як інформаційна система

  • Поняття інформації, даних та сигналу

  • Міри інформації

  • Основи кодування інформації

  • Дискретизація та квантування

  • Кодування

2.1. Комп’ютер як інформаційна система (система відбору, опрацювання та збереження інформації)

З практичної точки зору, комп’ютер – це деякий пристрій, призначений для відбору, перетворення (опрацювання) та збереження інформації. У цьому сенсі комп’ютер можна вважати інформаційною системою. Отже, поняття «комп’ютер» суттєво пов’язане з поняттям «інформація».