Отчет_Лаба1_ИИ_и_МО_Алексеева
.docУфимский государственный авиационный технический университет
ОТЧЕТ по лабораторной работе №1
по дисциплине:
«Искусственный интеллект и машинное обучение»
на тему:
«Поиск ассоциативных правил.»
Выполнил: бакалавр гр. ПРО-223
Алексеева А.В.
Исламгареев И. Д.
Проверил: Юдинцев Богдан Сергеевич
1 Цель работы
изучить алгоритмы поиска ассоциативных правил;
научиться выявлять ассоциативные правила с помощью различных инструментов (например, ПП «Deductor Studio»).
2 Теоретические основы
Ассоциативные правила позволяют находить закономерности между
связанными событиями.
Ассоциативные правила эффективно используются в сегментации покупателей по поведению при покупках, анализе предпочтений клиентов, планировании расположения товаров в супермаркетах, кросс-продажах, адресной рассылке.
Результат выполнения работы
1 Задание
видоизменила исходные данные, которые рассмотрены в методических указаниях
Рисунок 1 Исходные данные
2 задание
Реализовала алгоритм поиска ассоциативных правил в ПП «Deductor».
Проанализировала результаты:
Рисунок 2. 5 самых популярных наборов позиций
Рисунок 3. 10 ассоциативных правил
3 задание
Изучила алгоритм apriori, ознакомилась с общей информацией по библиотекам Numpy и Pandas (область применения, основные использующиеся классы/объекты для обработки данных).
Библиотека Numpy - техническая вычислительная библиотека:
Область применения:
Для выполнения сложных математических вычислений
Для представления изображений, звуковых волн и других форм двоичных необработанных потоков в виде массива действительных чисел в N-мерном
Для проектов машинного обучения
Основные использующиеся классы/объекты для обработки данных
Главной особенностью numpy является объект array. Массивы схожи со списками в python, исключая тот факт, что элементы массива должны иметь одинаковый тип данных, как float и int. С массивами можно проводить числовые операции с большим объемом информации в разы быстрее и, главное, намного эффективнее чем со списками.
Метод shape возвращает количество строк и столбцов в матрице
Метод dtype возвращает тип переменных, хранящихся в массиве
Метод in используется для проверки на наличие элемента в массиве
NumPy обеспечивает много функций для работы с векторами и матрицами. Функция dot возвращает скалярное произведение векторов. Функция dot также может умножать матрицы
NumPy предоставляет методы для работы с полиномами.
Функции polyadd, polysub, polymul и polydiv также поддерживают суммирование, вычитание, умножение и деление коэффициентов многочлена, соответственно.
Библиотека Pandas - высокоуровневая Python библиотека для анализа данных
Главные структуры данных библиотеки: DataFrame и Series.
Структура/объект Series представляет из себя объект, похожий на одномерный массив (питоновский список, например), но отличительной его чертой является наличие ассоциированных меток, т.н. индексов, вдоль каждого элемента из списка. Такая особенность превращает его в ассоциативный массив или словарь в Python.
Объект DataFrame лучше всего представлять себе в виде обычной таблицы и это правильно, ведь DataFrame является табличной структурой данных. В любой таблице всегда присутствуют строки и столбцы. Столбцами в объекте DataFrame выступают объекты Series, строки которых являются их непосредственными элементами.
4 задание
Запустила Apriori алгоритм поиска ассоциативных правил в среде Python, используя свой набор данных или используя файл checks.csv. Сравнила полученные результаты с выходными данными в ПП Deductor. Выбрала пять самых популярных наборов позицией и привела скриншоты таблиц данных правил из Deductor и python-программы.
Рисунок 4 Популярные наборы в программе Apriori
Рисунок 5 Популярные наборы в ПП Дедуктор
5. При увеличении значения support в программе apriori.py я заметила, что время обработки данных уменьшается, так как при увеличении значения support программа ищет только те пункты, у которых поддержка удовлетворяет условию в программе, а увеличение этого значения приводит к сужению круга искомых элементов.
Вывод
Изучила алгоритмы поиска ассоциативных правил; научилась выявлять ассоциативные правила с помощью различных инструментов (например, ПП «Deductor Studio»).
Уфа – 2020