- •Аннотация
- •Введение
- •Понятие нечеткого поиска и
- •1.1 Четкий и нечеткий поиск: базовые различия
- •1.2 Типичные ошибки ввода данных
- •Области применения нечеткого поиска
- •2. Алгоритмы оценки схожести строк
- •2.1. Расстояние Левенштейна: первый математический метод
- •2.2 Модификация Дамерау-Левенштейна: учет перестановок
- •2.3 Фонетические алгоритмы: Soundex и Mataphone
- •2.4 Метод n-грамм и его роль в индексации
- •Практическое применение нечеткого поиска
- •Нечеткий поиск в поисковых системах
- •3.2 Использование в интернет магазинах и базах данных
- •3.3 Современные тенденции: нейросети и семантический поиск
- •Заключение
- •Список использованных источников
МИНОБРНАУКИ РОССИИ
«Челябинский государственный университет»
(ФГБОУ ВО «ЧелГУ»)
Физический факультет
Кафедра теории управления и оптимизации
Реферат
по дисциплине «Современные технологии поиска и обработки информации»
Тема: Нечеткий поиск в информационных системах
Студент гр. ФФ-404 |
|
Агеев А.А. |
Преподаватель |
|
Ливанов Н.Д. |
Челябинск
2026
ЗАДАНИЕ
на реферат
Студент Агеев А.А. |
||
Группа ФФ-404 |
||
Тема реферата: «Нечеткий поиск в информационных системах»
|
||
Исходные данные: электронные ресурсы |
||
Предполагаемый объем реферата: не менее 15 страниц. |
||
Дата выдачи задания: 20.05.2026 |
||
Дата сдачи реферата: |
||
Дата защиты реферата: |
||
|
||
Студент |
|
Агеев А.А. |
Преподаватель |
|
Ливанов Н.Д. |
Аннотация
Проблема поиска информации при наличии ошибок ввода стала особенно актуальной с ростом неупорядоченных данных и массовым использованием поисковых систем неподготовленными пользователями. Во второй половине XX века были разработаны первые алгоритмы оценки схожести строк, позволяющие находить нужные данные даже при опечатках, заменах и пропусках символов. В настоящее время нечеткий поиск приобретает все большее практическое значение.
Сегодня имеются два главных направления в области применения нечеткого поиска: прежде всего - в поисковых системах общего назначения (Google, Яндекс) и справочных сервисах, а затем - в специализированных информационных системах: базах данных, интернет-магазинах, банковских и медицинских информационных системах. С момента появления первых критериев схожести строк нечеткий поиск превратился из лабораторного эксперимента в повседневный инструмент, обеспечивающий удобство работы пользователей.
Summary
The problem of searching for information in the presence of input errors has become especially relevant with the growth of disordered data and the massive use of search engines by untrained users. In the second half of the 20th century, the first algorithms for estimating the similarity of strings were developed, allowing to find the necessary data even with typos, substitutions and omissions of characters. Currently, fuzzy search is becoming increasingly important in practice.
Today there are two main directions in the application of fuzzy search: first of all search engines, General purpose (Google, Yandex) and reference services, and then specialized in information systems: databases, online shopping, banking and medical information systems. Since the first string similarity criteria appeared, fuzzy search has transformed from a laboratory experiment into an everyday tool that ensures user convenience.
содержание
|
Введение |
5 |
1. |
Понятие нечеткого поиска и предпосылки его возникновения |
6 |
1.1. |
Четкий и нечеткий поиск: базовые различия |
7 |
1.2. |
Типичные ошибки ввода данных |
8 |
1.3 |
Области применения нечеткого поиска |
9 |
2. |
Алгоритмы оценки схожести строк |
11 |
2.1. |
Расстояние Левенштейна: первый математический метод |
11 |
2.2. 2.3 |
Модификация Дамерау-Левенштейна: учет перестановок Фонетические алгоритмы: Soundex и Metaphone |
13 14 |
2.4 |
Метод n-грамм и его роль в индексации |
15 |
3. |
Практическое применение нечеткого поиска |
18 |
3.1. |
Нечеткий поиск в поисковых системах |
18 |
3.2. |
Использование в интернет-магазинах и базах данных |
19 |
3.3 |
Современные тенденции: нейросети и семантический поиск |
20 |
|
Заключение |
21 |
|
Список использованных источников |
22 |
