- •1. Теоретические основы математическая статистика Генеральная совокупность и выборка
- •Графическое представление вариационного ряда
- •Нормальное распределение
- •Аналитический анализ. Основные статистические характеристики ряда измерений
- •Характеристики положения
- •1. Среднее арифметическое значение
- •2. Мода
- •3. Медиана
- •Характеристики рассеяния результатов измерений
- •1. Размах вариации
- •2. Дисперсия
- •4. Ошибка средней арифметической (ошибка средней)
- •5. Коэффициент вариации
- •Характеристики формы распределения
- •2. Методика выполнения расчётно-графической работы №1
- •Пример выполнения расчётно-графической работы №1. Пример
- •Графическое представление вариационного ряда
- •Аналитический анализ.
- •3. Теоретические основы корреляционный анализ
- •Определение формы связи
- •Определение направления взаимосвязи
- •Определение степени или тесноты взаимосвязи
- •Парный линейный коэффициент корреляции Бравэ-Пирсона (r). Коэффициент детерминации (d)
- •Оценка достоверности статистических показателей
- •Статистические гипотезы
- •Виды статистических гипотез
- •Достоверность коэффициента корреляции
- •Регрессионный анализ
- •Линейная регрессия
- •Расчёт коэффициентов уравнений линейной регрессии
- •2. Методика выполнения расчётно-графической работы №2
- •Москва – 2012
- •Пример выполнения расчётно-графической работы №2.
- •Приложение
Расчёт коэффициентов уравнений линейной регрессии
Как уже было сказано выше, в случае линейной зависимости уравнение регрессии является уравнением прямой линии.
Различают
У = ау/х +bу/хХ - прямое уравнение регрессии;
Х = ах/у+bх/у Y - обратное уравнение регрессии.
Здесь а и b – коэффициенты, или параметры, которые определяются по формулам. Значение коэффициента b вычисляется
Из формул видно, что коэффициенты регрессии bу/х и bх/у имеют тот же знак, что и коэффициент корреляции, размерность, равную отношению размерностей изучаемых показателей Х и У, и связаны соотношением:
Для вычисления коэффициента а достаточно подставить в уравнения регрессии средние значения коррелируемых переменных
График теоретических линий регрессии (рис. 17) имеет вид:
Рис 17. Теоретические линии регрессии
Из приведённых выше формул легко доказать, что угловые коэффициенты прямых регрессии равны соответственно
Так как, то. Это означает, что прямая регрессииY на Х имеет меньший наклон к оси абсцисс, чем прямая регрессии Х на Y.
Чем ближе к единице, тем меньше угол между прямыми регрессии. Эти прямые сливаются только тогда, когда.
При прямые регрессии описываются уравнениями,.
Таким образом, уравнения регрессии позволяют:
определить, насколько изменяется одна величина относительно другой;
прогнозировать результаты.
2. Методика выполнения расчётно-графической работы №2
Расчётно-графическая работа содержит 4 раздела.
В первом разделе:
Формулируется тема;
Формулируется цель работы.
Во втором разделе:
Формулируется условие задачи;
Заполняется таблица исходных данных выборки.
В третьем разделе:
Результаты измерений представляются в виде вариационного ряда;
Даётся графическое представление вариационного ряда.
Формулируется вывод.
В четвёртом разделе:
Рассчитываются основные статистические характеристики ряда измерений;
По итогам расчётов формулируется вывод.
Оформление работы:
Работа выполняется в отдельной тетради или на форматных листах.
Титульный лист заполняется по образцу.
Российский Государственный Университет
физической культуры, спорта, молодёжи и туризма
Кафедра естественнонаучных дисциплин
Корреляционный и регрессионный анализы
Расчётно-графическая работа №2
по курсу математики
Выполнил: студент 1 к. 1 пот. 1гр.
Иванов С.М.
Преподаватель :
доц. кафедры ЕНД и ИТ
(Ф.И.О.)
Москва – 2012
(Пример оформления титульного листа)
Пример выполнения расчётно-графической работы №2.
Тема работы: Корреляционный и регрессионный анализы.
Цель работы: Определить взаимосвязь показателей двух выборок.
Ход выполнения работы:
Придумать две выборки из своего вида спорта с одинаковым объемом n.
Нарисовать корреляционное поле, сделать предварительный вывод.
Рассчитать коэффициент корреляции Бравэ-Пирсона и сделать вывод.
Определить достоверность коэффициента корреляции и сделать окончательный вывод.
Рассчитать коэффициент детерминации и сделать вывод о степени взаимосвязи показателей двух выборок.
Рассчитать коэффициенты прямого и обратного уравнений регрессии.
Построить теоретические линии регрессии на корреляционном поле и показать точку их пересечения.
1. Условие задачи: У группы спортсменов определяли результаты в беге на 100 м с барьерами Xi (с) и прыжках в длину Yi (м) (табл.). Проверить, существует ли корреляционная связь между исследуемыми признаками и определить достоверность коэффициента корреляции.
Таблица исходных данных выборки: Результаты приведены в таблице исходных данных.
Таблица 6
Результаты бега и прыжка
№ п/п |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Xi, с |
13,68 |
13,34 |
13,75 |
13,51 |
13,53 |
13,7 |
13,45 |
13,72 |
13,61 |
Yi, м |
6,35 |
6,83 |
6,25 |
6,38 |
6,42 |
6,35 |
6,51 |
6,06 |
6,22 |
№ п/п |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
Xi, с |
13,84 |
13,91 |
13,46 |
13,5 |
13,6 |
13,35 |
13,42 |
13,8 |
13,5 |
Yi, м |
6,20 |
6,00 |
6,50 |
6,65 |
6,55 |
6,75 |
6,60 |
6,18 |
6,55 |
Решение:
2. Построим корреляционное поле (диаграмму рассеяния) и сделаем предварительный вывод относительно связи между исследуемыми признаками.
Рис 18. Корреляционное поле
Предварительный вывод:
Связь между показателями результатов в беге на 100 м с барьерами Xi (с) и прыжками в длину Yi (см):
линейная;
отрицательная;
сильная.
3. Рассчитаем парный линейный коэффициент корреляции Бравэ – Пирсона, предварительно рассчитав основные статистические показатели двух выборок. Для их расчёта составим таблицу, в которой предпоследний и последний столбцы необходимы для расчёта стандартных отклонений, если они неизвестны. Для нашего примера эти значения рассчитаны в первой расчётно-графической работе, но для наглядности покажем расчёт дополнительно.
Таблица 7
Вспомогательная таблица для расчета коэффициента
корреляции Бравэ – Пирсона
№ |
Xi, с |
Yi, см | |||||
1 |
13,68 |
6,35 |
0,09 |
-0,06 |
-0,005 |
0,0081 |
0,0036 |
2 |
13,34 |
6,83 |
-0,25 |
0,42 |
-0,105 |
0,0625 |
0,18 |
3 |
13,75 |
6,25 |
0,16 |
-0,16 |
-0,03 |
0,0256 |
0,0256 |
4 |
13,51 |
6,38 |
-0,08 |
-0,03 |
0,0024 |
0,0064 |
0,0009 |
5 |
13,53 |
6,42 |
-0,06 |
0,01 |
-0,0006 |
0,0036 |
0,0001 |
6 |
13,7 |
6,35 |
0,11 |
-0,06 |
-0,0066 |
0,0121 |
0,0036 |
7 |
13,45 |
6,51 |
-0,14 |
0,1 |
-0,014 |
0,0196 |
0,01 |
8 |
13,72 |
6,06 |
0,13 |
-0,35 |
-0,0455 |
0,0169 |
0,1225 |
9 |
13,61 |
6,22 |
0,02 |
-0,19 |
-0,004 |
0,0004 |
0,0361 |
10 |
13,84 |
6,20 |
0,25 |
-0,21 |
-0,0525 |
0,0625 |
0,0441 |
11 |
13,91 |
6,00 |
0,32 |
-0,41 |
-0,1312 |
0,1024 |
0,1681 |
12 |
13,46 |
6,50 |
-0,13 |
0,09 |
-0,0117 |
0,0169 |
0,0081 |
13 |
13,5 |
6,65 |
-0,09 |
0,24 |
-0,0216 |
0,0081 |
0,0576 |
14 |
13,6 |
6,55 |
0,01 |
0,14 |
0,0014 |
0,0001 |
0,0196 |
15 |
13,35 |
6,75 |
-0,24 |
0,34 |
-0,0816 |
0,0576 |
0,1156 |
16 |
13,42 |
6,60 |
-0,17 |
0,19 |
-0,0323 |
0,0289 |
0,0361 |
17 |
13,8 |
6,18 |
0,21 |
-0,23 |
-0,0483 |
0,0441 |
0,0529 |
18 |
13,5 |
6,55 |
-0,09 |
0,14 |
-0,0126 |
0,0081 |
0,0196 |
n=18 |
13,59 |
6,41 |
|
|
∑=-0,6015
|
∑=0,4839 |
∑=0,9041 |
x =,
y =,
.
Полученное значение коэффициента корреляции позволяет подтвердить предварительный вывод и сделать окончательное заключение – связь между исследуемыми признаками:
линейная;
отрицательная;
сильная.
4. Определим достоверность коэффициента корреляции.
Предположим, что связь между результатом в беге на 100 м и прыжком в длину отсутствует (Но: r=0).
.
Находим = 2,12 дляα = 0,05 и = n - 2 = 16.
tрасчет > tтабл (19,6 > 2,12).
Вывод: существует сильная, отрицательная статистически достоверная (р=0,95) связь между бегом с препятствиями на дистанцию 100 м и прыжком в длину. Это означает, что с улучшением результата в прыжке в длину уменьшается время пробега дистанции 100 м.
5. Вычислим коэффициент детерминации:
.
Следовательно, только 96% взаимосвязи результатов в беге на 100 м с барьерами и в прыжке в длину объясняется их взаимовлиянием, а остальная часть, т. е. 4% объясняется влиянием других неучтённых факторов.
6. Рассчитаем коэффициенты прямого и обратного уравнений регрессии, воспользовавшись формулами, подставим значения рассчитанных коэффициентов в соответствующую формулу и запишем прямое и обратное уравнения регрессии:
Y = а1 + b1Х - прямое уравнение регрессии;
Х = а2 + b2 Y - обратное уравнение регрессии.
Воспользуемся результатами расчёта, приведёнными выше:
x =;y =;;13,59; 6,4,
Рассчитаем коэффициент b1, воспользовавшись формулой:
Для расчета коэффициента а1 подставим в прямое уравнение регрессии вместо b1 рассчитанное значение, а вместо Х и Y средние арифметические значения двух выборок из таблицы:
Подставим полученные значения коэффициентов а1 и b1 в прямое уравнение регрессии и запишем уравнение прямой линии:
Y = 22 - 1,15Х
Рассчитаем коэффициент b2, воспользовавшись формулой:
Для расчета коэффициента а2 подставим в прямое уравнение регрессии вместо b2 рассчитанное значение, а вместо Х и Y средние арифметические значения двух выборок из таблицы:
Подставим полученные значения коэффициентов а1 и b1 в прямое уравнение регрессии и запишем уравнение прямой линии:
Х = 18,92 - 0,83Y
Таким образом, мы получили прямое и обратное уравнения регрессии:
Y = 22 - 1,15Х - прямое уравнение регрессии;
Х = 18,92 - 0,83Y - обратное уравнение регрессии.
Для проверки правильности расчётов достаточно подставить в прямое уравнение среднее значение и определить значениеY. Полученное значение Y должно быть близким или равным среднему значению .
Y = 22 - 1,15 = 22 - 1,1513,59 = 6,4 =.
При подстановке в обратное уравнение регрессии среднего значения , полученное значение Х должно быть близким или равным среднему значению .
Х = 18,92 - 0,83= 18,92 - 0,83 6,4 = 13,6 = .
7. Построим линии регрессии на корреляционном поле.
Для графического построения теоретических линий регрессии, как и для построения любой прямой, необходимо иметь две точки из диапазона значений Х и Y.
Причём, в прямом уравнении регрессии независимая переменная Х, а зависимая Y, а в обратном – независимая переменная Y, а зависимая Х.
Y = 22 - 1,15Х
X |
13,42 |
13,8 |
Y |
6,57 |
6,13 |
Х = 18,92 - 0,83Y
Y |
6,2 |
6,6 |
X |
13,77 |
13,44 |
Координатами точки пересечения линий прямого и обратного уравнений регрессии являются значения средних арифметических двух выборок (с учётом погрешностей округлений при приближённых расчётах).
Вывод: зная результат бега с препятствиями на дистанцию 100 м, по прямому уравнению регрессии, можно теоретически определить результат прыжка в длину; и наоборот, зная результат прыжка в длину по обратному уравнению регрессии, можно определить результат бега с препятствиями.