
- •Постановка задачи иад
- •Графический разведочный анализ данных
- •Анализ качественных данных:
- •Анализ количественных данных
- •Предварительный разведочный анализ данных
- •Результаты проверки гипотезы о согласии распределения выборочных данных
- •Расчет критерия хи-квадрат и рангового коэффициента корреляции Спирмена.
- •Корреляционные матрицы
- •Частные корреляционные матрицы
Постановка задачи иад
Цель работы:
изучить возможности и освоить основные принципы работы в интегрированной статистической системе Statistica;
получить практические навыки создания, анализа, визуализации данных в Statistica;
изучить средства Statistica для проведения первичного разведочного анализа данных (методы визуализации и аналитические методы) на примере решения конкретной задачи ИАД.
Содержательная постановка задачи
Исследуются покупатели Интернет-магазина. Было опрошено 200 клиентов, каждому анкетируемому предлагалось ответить на следующие вопросы:
возраст;
пол;
количество покупок за год;
средняя стоимость покупок за год;
среднее число страниц, просмотренных за визит;
количество обращений в службу поддержки за год;
степень удовлетворенности услугами;
степень активности (участие в Интернет-опросах)
Необходимо провести предварительный разведочный анализ данных с целью описания характера распределения данных, выявления структуры взаимосвязей между показателями.
Анкетируемые разбиты на две группы. Признак разделения на группы указан в варианте.
Графический разведочный анализ данных
Анализ качественных данных:
Категоризованные радиальные диаграммы для качественных переменных.
Рисунок 1 – Круговая диаграмма процентного содержания мужчин и женщин в каждой группе
В группе 1 больше женщин, а в группе 2 – мужчин.
Рисунок 2 – круговая диаграмма степени удовлетворенности услугами в каждой группе и для каждого пола
Степень удовлетворенности услугами выше всего в группе 2 у женщин и ниже всего в группе 1 у женщин.
Рисунок 3 – Круговая диаграмма участия в Интернет-опросах каждого пола посетителей.
Участие в Интернет-опросах примерно одинаково среди обоих полов, но более активными являются женщины.
Рисунок 4 – Круговая диаграмма, отражающая участие клиентов каждой группы в Интернет-опросах
Участие в Интернет-опросах примерно одинаково для обеих групп, но более активна вторая группа посетителей.
Рисунок 5 – Круговая диаграмма, отражающая процентное содержание степени удовлетворенности услугами клиентов для каждого из полов
Женщины удовлетворены услугами больше, чем мужчины.
Таблица сопряженности для качественных переменных
Рисунок 6 – Таблица сопряженности для переменных Группа и Пол
Рисунок 7 - Таблица сопряженности для переменных Участие в Интернет-опросах и Пол
Рисунок
8 - Таблица сопряженности для переменных
Степень удовлетворенности услугами и
Пол
Рисунок 9 – Таблица сопряженности для переменных Степень удовлетворенности услугами и Группа
Рисунок 10 - Таблица сопряженности для участие в Интернет-опросах и Группа
Категоризованная гистограмма, трехмерная гистограмма, график взаимодействия частот.
Для переменных Пол и Группа
Рисунок 11 – Категоризированная гистограмма для переменных Пол и Группа
Рисунок 12 – Трехмерная гистограмма для переменных Пол и Группа
Рисунок 13 – График взаимодействия частот для переменных Пол и Группа
В первой группе преобладает больше мужчин, а во второй – женщин.
Для переменных Пол и Участие в Интернет-опросах
Рисунок 14 - Категоризированная гистограмма для переменных Пол и Участие в Интернет-опросах
Рисунок 15 – Трехмерная гистограмма для переменных Пол и Участие в Интернет-опросах
Рисунок 16 – График взаимодействия частот для переменных Пол и Участие в Интернет-опросах
Участие в опросах примерно одинаково для обоих полов, но активность участия выше у женщин. Трудно выдвинуть гипотезу о законе распределения.
Для переменных Пол и Степень удовлетворенности услугами
Рисунок 17 - Категоризированная гистограмма для переменных Пол и Степень удовлетворенности услугами
Рисунок 18 – Трехмерная гистограмма для переменных Пол и Степень удовлетворенности услугами
Рисунок 19 – График взаимодействия частот для переменных Пол и Степень удовлетворенности услугами
Мужчины и женщины примерно одинаково удовлетворены услугами.
Нормальный закон распределения.
Для переменных Степень удовлетворенности услугами и Группа
Рисунок 20 - Категоризированная гистограмма для переменных Группа и Степень удовлетворенности услугами
Рисунок 21 – Трехмерная гистограмма для переменных Группа и Степень удовлетворенности услугами
Рисунок 22– График взаимодействия частот для переменных Группа и Степень удовлетворенности услугами
Люди вторая группы более удовлетворены услугами. Нормальный закон распределения.
Для переменных Группа и Участие в Интернет-опросах
Рисунок 23 - Категоризированная гистограмма для переменных Группа и Участие в Интернет-опросах
Рисунок 24 – Трехмерная гистограмма для переменных Группа и Участие в Интернет-опросах
Рисунок 25– График взаимодействия частот для переменных Группа и Участие в Интернет-опросах
Участие в Интернет-опросах примерно одинаково для обеих групп, но более активны опрошенные второй группы. Нормальный закон распределения.