МИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ,
СВЯЗИ И МАССОВЫХ КОММУНИКАЦИЙ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»
(СПбГУТ)
Факультет Информационных технологий и программной инженерии
Кафедра Систем обработки данных
Направление: 09.03.02 Информационные системы и технологии
Профиль: Прикладные информационные системы и технологии
Лабораторная работа №5
«Разработка прототипа экспертной системы»
по дисциплине
«Интеллектуальные системы и технологии»
Выполнил:
студент группы ИСТ-223
Хакова Ю.М. «____» _________2026 г.
Принял:
ассистент кафедры ИУС
Пелих Д.А. «____» _________2026 г.
Цель работы:
Изучить, как применение логических операторов улучшает или ограничивает поиск информации в интернете. Развить навыки эффективного сбора и анализа данных с использованием современных поисковых систем, научиться оценивать эффективность поисковых систем с использованием метрик качества, таких как точность (precision), полнота (recall) и F1-мера. Понимать работу этих систем, а также использовать ИИ для получения информации.
Ход работы
1. Формирование запросов
Для выполнения лабораторной работы была выбрана тема «Кибербезопасность в условиях развития искусственного интеллекта».
В рамках темы были выделены 5 ключевых аспектов:
кибербезопасность
искусственный интеллект
защита данных
машинное обучение
киберугрозы
Композитный запрос
Был составлен следующий поисковый запрос с использованием логических операторов и фильтров:
Запрос (Google / Bing):
("кибербезопасность" AND "искусственный интеллект" AND "защита данных") AND ("машинное обучение" OR "киберугрозы") -игры after:2023 filetype:pdf
Запрос (Яндекс):
"кибербезопасность" & "искусственный интеллект" & "защита данных" & ("машинное обучение" | "киберугрозы") -игры
Анализ проводился по первым 10–20 результатам.
Таблица 1 – Сравнение результатов
|
Всего результатов |
Релевантные |
Спам/устаревшее |
Типы источников (научные, блоги, новости) |
10 |
5 |
5 |
60% статьи, 30% блоги, 10% новости |
|
Яндекс |
10 |
6 |
4 |
50% новости, 40% блоги, 10% статьи |
Bing |
10 |
5 |
5 |
90% статьи, 5% отчёты 5% презентации |
Вывод по поисковым системам
По результатам анализа было установлено, что:
Google показывает наиболее релевантные результаты
Яндекс содержит больше новостных и менее точных источников
Bing демонстрирует средние показатели
Использование операторов AND, OR, NOT и фильтров (after:2023, filetype:pdf) значительно повысило точность поиска и уменьшило количество нерелевантных результатов.
2. Работа с дескрипторами
Была сформирована дескрипторная система.
Синонимичные:
кибербезопасность
информационная безопасность
защита данных
Родовидовые:
безопасность
кибербезопасность
защита сети
Ассоциативные:
хакер
вирус
атака
Таблица 2 - Синонимичные дескрипторы
Дескриптор |
|
Релевантность |
||
кибербезопасность |
~12 500 000 |
высокая |
||
информационная безопасность |
~18 200 000 |
высокая |
||
защита данных |
~25 700 000 |
высокая |
При использовании синонимичных дескрипторов наблюдается большое количество результатов, при этом большинство из них соответствует теме поиска. Это связано с тем, что данные термины близки по смыслу и часто используются взаимозаменяемо.
Таблица 3 - Родовидовые дескрипторы
Дескриптор |
|
Релевантность |
||
безопасность |
~320 000 000 |
средняя |
||
кибербезопасность |
~12 500 000 |
высокая |
||
защита сети |
~9 800 000 |
высокая |
При использовании родо-видовых дескрипторов было установлено, что более общий термин («безопасность») даёт значительно больше результатов, однако их релевантность ниже. Более узкие термины обеспечивают более точную и тематическую выдачу.
Таблица 4 – Ассоциативные дескрипторы
Дескриптор |
|
Релевантность |
||
хакер |
~45 000 000 |
средняя |
||
вирус |
~210 000 000 |
низкая |
||
атака |
~150 000 000 |
средняя |
Ассоциативные дескрипторы значительно расширяют область поиска, однако часто приводят к появлению нерелевантных результатов, так как используются в различных контекстах, не всегда связанных с кибербезопасностью.
Проведённый анализ показал, что синонимичные дескрипторы обеспечивают высокую релевантность результатов при большом объёме выдачи. Родо-видовые дескрипторы позволяют регулировать уровень обобщённости поиска: более общие термины увеличивают количество результатов, но снижают их точность, тогда как более узкие — наоборот. Ассоциативные дескрипторы значительно расширяют поиск, однако могут снижать его релевантность за счёт появления нерелевантной информации. Это подтверждает, что грамотный выбор дескрипторов является важным фактором повышения эффективности поиска информации.
