- •Оглавление
- •Лабораторная работа №1 Основные термины. Знакомство с программами для статистического анализа: пакет анализа ms Excel и Statistica 6. Краткие сведения из теории
- •Количество членов выборки с заданным конкретным значением/Объем выборки
- •Общая схема статистического анализа данных
- •Программы для статистического анализа Построение распределения значений признака
- •Первый запуск
- •Контрольные вопросы
- •Лабораторная работа №2 Описательная статистика. Построение графиков распределения Краткие сведения из теории
- •Описательная статистика
- •Подготовительные процедуры
- •Первичный анализ статистических данных (описательная статистика)
- •Контрольные вопросы
- •Лабораторная работа №3
- •Сравнение групп
- •Дисперсионный анализ
- •Краткие сведения из теории
- •Позволяет ли правильное лечение сократить срок госпитализации?
- •Галотан и морфин при операциях на открытом сердце
- •Контрольные вопросы
- •Лабораторная работа №4
- •Сравнение групп
- •Критерий Стьюдента
- •Краткие сведения из теории
- •Позволяет ли правильное лечение сократить срок госпитализации?
- •Контрольные вопросы
- •Лабораторная работа №5 Анализ зависимостей. Корреляционный и регрессионный анализ. Парная корреляция Краткие сведения из теории
- •Корреляционный анализ
- •Регрессионный анализ
- •Корреляционный и регрессионный анализ
- •Контрольные вопросы
- •Лабораторная работа №6 Криволинейная корреляция и регрессия Краткие сведения из теории
- •Проведение анализа
- •Var1 – независимая переменная –X;Var2 – зависимая переменная – y.
- •Контрольные вопросы
- •Сравнение двух выборок: критерий манна—уитни (независимые (несвязанные) группы)
- •Сравнение наблюдений до и после лечения: критерий уилкоксона (зависимые (связанные) группы)
- •Сравнение нескольких групп: критерий крускала-уоллиса (независимые (несвязанные) группы)
- •Повторные измерения: критерий фридмана (зависимые (связанные) группы)
- •Сравнение двух выборок: критерий манна—уитни (независимые (несвязанные) группы)
- •Сравнение наблюдений до и после лечения: критерий уилкоксона (зависимые (связанные) группы)
- •Сравнение нескольких групп: критерий крускала-уоллиса (независимые (несвязанные) группы)
- •Повторные измерения: критерий фридмана (зависимые (связанные) группы)
- •Порядок анализа в Stastistica 6
- •Контрольные вопросы
- •Лабораторная работа №8 Анализ качественных признаков Краткие сведения из теории
- •В некотором смысле доля раналогична среднемуµпо совокупности
- •Тромбоз шунта у больных на гемодиализе
- •Контрольные вопросы
- •Лабораторная работа №9 Классификация. Кластерный и дискриминантный анализы Краткие сведения из теории
- •Кластер– это тип объектов, схожих по определенному признаку
- •Классификация населенных пунктов, расположенных в зоне радиоактивного загрязнения
- •Контрольные вопросы
Корреляционный анализ
Выполнение корреляционного анализа покажем на примере результатов измерения массы (Y) и длины туловища (X) исследуемой группы животных. Исходные данные представлены в таблице (в табличном редактореMS Excelданные представлены двумя столбцами). Скопируйте любую пару значений (Х и У) наЛист 1программыMSExcel.
Исходные данные
X |
Y |
3,4 |
14,3 |
3,6 |
14,9 |
4,5 |
17,3 |
4,8 |
17,3 |
4,9 |
17,4 |
5,2 |
17,5 |
5,4 |
17,6 |
5,7 |
17,6 |
6,2 |
17,6 |
6,7 |
17,8 |
7,1 |
18 |
7,5 |
18 |
7,7 |
18,1 |
7,8 |
18,1 |
7,9 |
18,6 |
8 |
19,7 |
Откройте модуль Анализ данных, выберите опциюКорреляция, после чего щелкните мышкойOK.
В появившемся окне выполните операции и установки, как показано на рисунке.
Стартовая панель (ваши значения в ячейке входной и выходной интервалмогут отличаться,метки в первой строкеставятся при условии, что входной интервал включает заголовки таблицы Х и У)
Щелкнете мышкой OK. Результат обработки появится в указанном поле (выходной интервал $Е$1).
Результат обработки:
|
X |
Y |
X |
1 |
|
Y |
0,85 |
1 |
В полученной таблице нас интересует значение в ячейке на пересечении Х и У - 0,85. Это и есть значениекоэффициента корреляции.
О чем говорит данное полученное числовое значение коэффициента корреляции?
Регрессионный анализ
Для выполнения регрессионного анализа использовались исходные данные таблицы.
Откройте модуль Анализ данных и выберите опциюРегрессия, после чего щелкните мышкойOK.
В появившемся окне выполните операции и установки, как показано на рисунке ниже.
Стартовая панель регрессионного анализа
Щелкните мышкой OK. Результат обработки появится в указанном поле (выходной интервал $I$1).
Результат обработки:
Параметры |
Значения |
Множественный R |
0,847 |
R-квадрат |
0,719 |
Нормированный R-квадрат |
0,699 |
Стандартная ошибка |
0,701 |
Наблюдения |
16 |
Дисперсионный анализ
Параметры |
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
17,59 |
17,59 |
35,759 |
0,000.. |
Остаток |
14 |
6,887 |
0,492 |
|
|
Итого |
15 |
24,478 |
|
|
|
Регрессионный анализ
Параметры |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-значение |
Y-пересечение |
13,289 |
0,724 |
18,365 |
0,000.. |
X |
0,697 |
0,117 |
5,98 |
0,000.. |
Таким образом, корреляционная связь между массой и длиной туловища исследуемой группы животных характеризуется высоким (r=0,85) и достоверным коэффициентом корреляции (достоверность проверяетсякритерием Фишера, из таблицы: критерий ФишераF= 35,759 приуровне значимости Fсущественно меньшем 0,05). Получена очень надежная регрессия, о чем свидетельствует t-статистика из таблицы (уровень значимости существенно меньше 0,05).
Уравнение линейной регрессии Пирсонаи коэффициент корреляции:
.
С менее подробной информацией операции регрессии и корреляции можно выполнить в системе MSExcel, используя модульМастер диаграмм.
В системе MSExcelоткройте модульМастер диаграмм (Вставка-Диаграммы-Точечная – для Excel2010), предварительно выделив значения переменных Х и У.
Вставка – Диаграммы – Точечная – для Excel2010
Выберите Тип диаграммы Точечная.
Оформите график используя инструменты по работе с диаграммами согласно вашему усмотрению.
На графике щелкните правой кнопкой по любой точке диаграммы.
Выберите опцию Добавить линию тренда иТип – линейная. Щелкните мышкойOK.
Выберите установки, как показано на рисунке. Щелкните мышкой OK.
Тип аппроксимации кривой и параметры кривой (Excel2010)
Отредактированная диаграмма представлена на рисунке.
Отредактированная диаграмма с уравнением регрессии и коэффициентом детерминации
Уравнение регрессии и коэффициент детерминации R2находятся в правом нижнем углу диаграммы. Как видно, что они такие же, как и при выполнении регрессионного анализа в пакетеАнализ данных - Регрессия.
Порядок анализа в Statistica 6