Скачиваний:
1
Добавлен:
07.06.2026
Размер:
897.84 Кб
Скачать

МИНИСТЕРСТВО ЦИФРОВОГО РАЗВИТИЯ,

СВЯЗИ И МАССОВЫХ КОММУНИКАЦИЙ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»

(СПбГУТ)

Факультет Информационных технологий и программной инженерии

Кафедра Систем обработки данных

Направление: 09.03.02 Информационные системы и технологии

Профиль: Прикладные информационные системы и технологии

Лабораторная работа №5

«Разработка прототипа экспертной системы»

по дисциплине

«Интеллектуальные системы и технологии»

Выполнил:

студент группы ИСТ-223

Хакова Ю.М. «____» _________2026 г.

Принял:

ассистент кафедры ИУС

Пелих Д.А. «____» _________2026 г.

Цель работы:

Изучить, как применение логических операторов улучшает или ограничивает поиск информации в интернете. Развить навыки эффективного сбора и анализа данных с использованием современных поисковых систем, научиться оценивать эффективность поисковых систем с использованием метрик качества, таких как точность (precision), полнота (recall) и F1-мера. Понимать работу этих систем, а также использовать ИИ для получения информации.

Ход работы

1. Формирование запросов

Для выполнения лабораторной работы была выбрана тема «Кибербезопасность в условиях развития искусственного интеллекта».

В рамках темы были выделены 5 ключевых аспектов:

  • кибербезопасность

  • искусственный интеллект

  • защита данных

  • машинное обучение

  • киберугрозы

Композитный запрос

Был составлен следующий поисковый запрос с использованием логических операторов и фильтров:

Запрос (Google / Bing):

("кибербезопасность" AND "искусственный интеллект" AND "защита данных") AND ("машинное обучение" OR "киберугрозы") -игры after:2023 filetype:pdf

Запрос (Яндекс):

"кибербезопасность" & "искусственный интеллект" & "защита данных" & ("машинное обучение" | "киберугрозы") -игры

Анализ проводился по первым 10–20 результатам.

Таблица 1 – Сравнение результатов

Всего результатов

Релевантные

Спам/устаревшее

Типы источников (научные, блоги, новости)

Google

10

5

5

60% статьи, 30% блоги, 10% новости

Яндекс

10

6

4

50% новости,

40% блоги, 10% статьи

Bing

10

5

5

90% статьи, 5% отчёты 5% презентации

Вывод по поисковым системам

По результатам анализа было установлено, что:

  • Google показывает наиболее релевантные результаты

  • Яндекс содержит больше новостных и менее точных источников

  • Bing демонстрирует средние показатели

Использование операторов AND, OR, NOT и фильтров (after:2023, filetype:pdf) значительно повысило точность поиска и уменьшило количество нерелевантных результатов.

2. Работа с дескрипторами

Была сформирована дескрипторная система.

Синонимичные:

  • кибербезопасность

  • информационная безопасность

  • защита данных

Родовидовые:

  • безопасность

  • кибербезопасность

  • защита сети

Ассоциативные:

  • хакер

  • вирус

  • атака

Таблица 2 - Синонимичные дескрипторы

Дескриптор

Количество результатов

Релевантность

кибербезопасность

~12 500 000

высокая

информационная безопасность

~18 200 000

высокая

защита данных

~25 700 000

высокая

При использовании синонимичных дескрипторов наблюдается большое количество результатов, при этом большинство из них соответствует теме поиска. Это связано с тем, что данные термины близки по смыслу и часто используются взаимозаменяемо.

Таблица 3 - Родовидовые дескрипторы

Дескриптор

Количество результатов

Релевантность

безопасность

~320 000 000

средняя

кибербезопасность

~12 500 000

высокая

защита сети

~9 800 000

высокая

При использовании родо-видовых дескрипторов было установлено, что более общий термин («безопасность») даёт значительно больше результатов, однако их релевантность ниже. Более узкие термины обеспечивают более точную и тематическую выдачу.

Таблица 4 – Ассоциативные дескрипторы

Дескриптор

Количество результатов

Релевантность

хакер

~45 000 000

средняя

вирус

~210 000 000

низкая

атака

~150 000 000

средняя

Ассоциативные дескрипторы значительно расширяют область поиска, однако часто приводят к появлению нерелевантных результатов, так как используются в различных контекстах, не всегда связанных с кибербезопасностью.

Проведённый анализ показал, что синонимичные дескрипторы обеспечивают высокую релевантность результатов при большом объёме выдачи. Родо-видовые дескрипторы позволяют регулировать уровень обобщённости поиска: более общие термины увеличивают количество результатов, но снижают их точность, тогда как более узкие — наоборот. Ассоциативные дескрипторы значительно расширяют поиск, однако могут снижать его релевантность за счёт появления нерелевантной информации. Это подтверждает, что грамотный выбор дескрипторов является важным фактором повышения эффективности поиска информации.