
- •Содержание
- •Введение
- •Часть 1. Теоретические сведения об алгоритмах поиска подстроки в строке
- •Основные понятия.
- •Строка, её длина, подстрока.
- •1.1.2. Понятие о сложности алгоритма.
- •1.2. Алгоритмы основанные на методе последовательного поиска.
- •1.2.1. Алгоритм последовательного (прямого) поиска (The Brute Force Algorithm).
- •1.2.2. Алгоритм Рабина.
- •Алгоритм Кнута - Морриса - Пратта (кмп).
- •1.4. Алгоритм Бойера – Мура и некоторые его модификации.
- •1.4.1. Алгоритм Боейера – Мура.
- •1.4.2. Модификации бм. Быстрый поиск (Классификация Thierry Lecroq [2]).
- •Т Листинг 6 урбо бм (Классификация Thierry Lecroq [2]).
- •1.5. Поиск подстрок с помощью конечного автомата.
- •1.5.1. Структура автомата.
- •1.5.2 Автоматные языки
- •1.5.3.Пример построения конечного автомата
- •1.6 Специфические алгоритмы
- •1.6.1 Турбо - обращение сегмента
- •1.6.2 Алгоритм Сдвига-Или
- •Часть 2.Экспериментальный анализ алгоритмов
- •2.1. Работа программы и результат
- •2.2. Суть эксперимента.
- •2.2. Результаты и анализ эксперимента.
- •Список литературы
Содержание
1.5.2 Автоматные языки 19
Введение
Цель курсовой работы: Изучить и проанализировать алгоритмы поиска подстроки в строке, и рассмотреть ряд практических задач на данную тематику.
Задачи курсовой работы: изучить задачи связанные с проблемой поиска подстроки в строке, дать основные определения; рассмотреть применение различных алгоритмов поиска подстроки в строке на практике; написать программный код, реализующий один из алгоритмов поиска подстроки в строке.
Те, кому приходиться часто работать с текстовыми редакторами, знают цену функции нахождения нужных слов в тексте, существенно облегчающей редактирование документов и поиск нужной информации. Действительно, современные программы обработки текста приучили нас к такой удобной возможности, как поиск и замена фрагментов, и если вы разрабатываете подобную программу, пользователь вправе ожидать, что вы предоставите в его распоряжение соответствующие команды.
Конечно, сейчас функции поиска инкапсулированы во многие языки программирования высокого уровня – чтобы найти строчку в небольшом тексте вы, наверное, используете встроенную функцию. Но если такого рода поиск является ключевой задачей вашей программы, знать принципы организации функций поиска будет совсем нелишне. При этом. в готовых подпрограммах далеко не всегда все написано лучшим образом. Во-первых, в стандартных функциях не всегда используются самые эффективные алгоритмы, а во-вторых, вполне возможно, что вам понадобится изменить стандартное поведение этих функций (например, предусмотреть возможность поиска по шаблону). Наконец, область применения функции поиска не ограничивается одними лишь текстовыми редакторами. Следует отметить использование алгоритмов поиска при индексации страниц поисковым роботом, где актуальность информации напрямую зависит от скорости нахождения ключевых слов в тексте html – страницы [9, с. 10]. Работа простейшего спам – фильтра, заключается в нахождении в тексте письма фраз таких, как «Миллион за час» или «Раскрутка сайта». Все вышесказанное говорит об актуальности проблемы, затрагиваемой работой.
Поставим задачу поиска подстроки в строке. Пусть у нас есть строка, состоящая из некоторого количества символов. Нам нужно проверить, входит ли другая заданная строка в данный текст, и если входит, то начиная с какого символа текста.
В данной работе мы ставим цель, выявить наиболее оптимальный алгоритм, решающий поставленную задачу поиска.
Задачи данной работы:
рассмотреть основные алгоритмы, решающих задачу поиска;
систематизировать алгоритмы согласно используемым в них приемам;
выявить эффективные, с точки зрения времени выполнения, алгоритмы.
Работа содержит две основных части. В первой будут рассмотрены алгоритмы, их теоретическое обоснование, алгоритмическая модель, будет проведена попытка их классификации. Во второй части работы будут приведены данные о практическом применении алгоритмов. В заключении будет сделан вывод о наиболее эффективном (с временной точки зрения) алгоритме.