- •Раздел 1. Элементы теории вероятностей и математической статистики 2
- •Раздел 2. Основы проверки статистических гипотез 65
- •Раздел 1. Элементы теории вероятностей и математической статистики
- •1. Основные определения и теоремы
- •1.1. Предмет теории вероятности
- •1.2. Событие как результат испытания
- •1.3. Частость и вероятность. Классическое определение вероятности
- •1.4. Теорема сложения вероятностей
- •1.5. Теорема умножения вероятностей
- •2. Повторные независимые испытания
- •2.1. Биномиальное распределение вероятностей
- •2.2. Наивероятнейшее число появлений события
- •2.3. Асимптотическая формула биномиального распределения (локальная терема Лапласа). Формула Пуассона
- •2.4. Интегральная теорема Лапласа
- •Упражнения.
- •3. Случайная величина и ее числовые характеристики
- •3.1. Случайная величина и ее распределение
- •3.2. Математическое ожидание и его свойства
- •3.3. Дисперсия и среднее квадратическое отклонение
- •3.4. Нормальный закон распределения и понятие о теореме Ляпунова
- •4. Закон больших чисел
- •4.1. Неравенства Маркова и Чебышева
- •4.2. Теорема Чебышева
- •5. Основные сведения из математической статистики
- •5.1. Генеральная совокупность и выборка
- •5.2. Устойчивость выборочных средних
- •5.3. Определение параметров выборки с помощью теоремы Ляпунова
- •5.4. Понятие о доверительных границах для средних
- •5.5. Примеры математической обработки данных выборочного наблюдения
- •5.6. Понятие о критериях согласия
- •6. Элементы теории корреляции
- •6.1. Функциональная и корреляционная зависимости
- •6.2. Линейная корреляция.
- •6.3. Коэффициент корреляции
- •6.4. Упрошенный способ вычисления коэффициента корреляции
- •6.5. Простейшие случаи криволинейной корреляции
- •6.6. Понятие о множественной корреляции
- •Упражнения
- •Раздел 2. Основы проверки статистических гипотез
- •1. Статистические модели
- •2. Проверка статистических гипотез (общие положения)
- •3. Примеры статистических моделей и гипотез, ранги и ранжирование
- •4. Проверка статистических гипотез (прикладные задачи)
- •4.1. Схема испытаний Бернулли
- •4.2. Критерий знаков для одной выборки
- •5. Проверка гипотез в двухвыборочных задачах
- •5.1. Критерий Манна-Уитни
- •5.2. Критерий Уилкоксона
- •6. Парные наблюдения
- •6.1. Критерий знаков для анализа парных повторных наблюдений
- •6.2. Анализ повторных парных наблюдений с помощью знаковых рангов (критерий знаковых ранговых сумм Уилкоксона)
- •Список использованной литературы
- •Список рекомендуемой литературы
6.4. Упрошенный способ вычисления коэффициента корреляции
Выше в п.п. 6.2 и 6.3, при составлении уравнений прямых регрессии либо по данным корреляционной таблицы непосредственно вычислялись коэффициенты регрессии, либо по тем же данным предварительно вычислялся коэффициент корреляции. В обоих случаях вычисления были очень громоздкими (операции с многозначными числами).
Между тем при постоянных разностях для
рассматриваемых в таблицах значений х
и у (в табл. 1
и
,
а в табл. 6
и
)
можно заметно упростить вычисления,
используя линейное преобразование
переменных по формулам:
и
где
и
—
произвольно
выбираемые значения из заданных значений
переменных х
и
у,
а
и и
v
—
новые
переменные.
Так, для рассматриваемых значений х и у в табл. 1 можно провести преобразования
и
,
при которых соответствие между значениями х и и, а также между y и v отражено в табл. 8а и 8б.
Если же применяются преобразования
и
,
то получается другое соответствие (см. табл. 8в и 8г).
Таблица 8
а |
|
б |
|
в |
|
г |
||||
х |
и |
|
y |
v |
|
x |
u |
|
y |
v |
25 35 45 55 65 75 85 95 105 115 125 |
0 1 2 3 4 5 6 7 8 9 10 |
|
13 18 23 28 33 38 43 48 53 58 63 68 |
0 1 2 3 4 5 6 7 8 9 10 11 |
|
25 35 45 55 65 75 85 95 105 115 125 |
-5 -4 -3 -2 -1 0 1 2 3 4 5 |
|
13 18 23 28 33 38 43 48 53 58 63 68 |
-5 -4 -3 -2 -1 0 1 2 3 4 5 6 |
Преобразования второй серии обеспечивают большее упрощение вычислений, так как в этом случае все операции ведутся с меньшими по абсолютной величине числами.
Для обоснования этих линейных преобразований
и
можно показать, что операции над переменными х и у, связанные с вычислением коэффициента корреляции и коэффициентов регрессии, сводятся при этих преобразованиях к аналогичным операциям над новыми переменными и и v.
Прежде всего следует заметить, что средним значениям х и у соответствуют средние значения переменных и и v:
Отсюда, при зависимости
будет и
Таким же образом можно установить, что
,
или
.
Далее, разность
а поэтому
Аналогично устанавливается, что
.
Эти результаты показывают, что участвующие
в вычислениях средние квадратические
отклонения принимают вид
и
.
Наконец, преобразование разности
дает
.
Таким образом, переход к новым переменным дает преобразованную форму коэффициента корреляции и коэффициентов регрессии:
Для составления уравнений регрессии с помощью новых переменных следует включать в корреляционную таблицу значения этих новых переменных, найденные по формулам:
и
.
Удобней всего применять для этой цели исходную таблицу, помещая в ней значения и слева от соответственных значении х, а значения v — над соответственными значениями у. При этом вспомогательный характер значений и и v в таблице обычно оттеняется применением для них мелкого шрифта.
Для иллюстрации тех упрощений, которые достигаются введением новых переменных, используем этот способ на уже рассмотренном примере с распределением растений житняка. В виде значений и переменных х и у выгодней всего используются их средние или ближайшие к ним значения этих переменных. В примере с растениями житняка именно такую замену представляют данные второго преобразования. Поставленные во вторых столбцах табл. 8в и 8г числа получены таким образом: для значений переменной и преобразованием
,
а для значений переменной v преобразованием
.
Вся операция по отысканию параметров уравнений регрессии проводится по отдельным этапам.
Корреляционная таблица 1 пополняется значениями и и v.
Для отыскания коэффициента корреляции составляется вспомогательная таблица (см. табл. 10) с вычислением ее итоговых данных.
Таблица 9
|
v |
-5 |
-4 |
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
|
|
y x |
13 |
18 |
23 |
28 |
33 |
38 |
43 |
48 |
53 |
58 |
63 |
68 |
|
-5 |
25 |
3 |
2 |
|
|
|
|
|
|
|
|
|
|
5 |
-4 |
35 |
|
6 |
4 |
|
|
|
|
|
|
|
|
|
10 |
-3 |
45 |
|
1 |
13 |
5 |
|
|
|
|
|
|
|
|
19 |
-2 |
55 |
|
1 |
2 |
4 |
8 |
1 |
|
|
|
|
|
|
16 |
-1 |
65 |
|
|
1 |
|
4 |
4 |
2 |
|
|
|
|
|
11 |
0 |
75 |
|
|
|
|
2 |
6 |
6 |
2 |
|
|
|
|
16 |
1 |
85 |
|
|
|
|
|
|
1 |
5 |
|
|
|
|
6 |
2 |
95 |
|
|
|
|
|
|
|
1 |
4 |
1 |
|
|
6 |
3 |
105 |
|
|
|
|
|
|
|
|
2 |
4 |
1 |
1 |
8 |
4 |
115 |
|
|
|
|
|
|
|
|
|
1 |
|
1 |
2 |
5 |
125 |
|
|
|
|
|
|
|
|
|
|
|
1 |
1 |
|
|
3 |
10 |
20 |
9 |
14 |
11 |
9 |
8 |
6 |
6 |
1 |
3 |
100 |
По данным подсчетов:
Следует заметить, что
,
а также что формулы преобразования
и
позволяют: по найденным средним значениям
новых переменных
и
сразу получить средние значения старых переменных:
|
u |
|
|
|
|
v |
|
|
5 10 19 16 11 16 6 6 8 2 1 |
-5 -4 -3 -2 -1 0 1 2 3 4 5 |
-25 -40 -57 -32 -11 0 6 12 24 8 5 |
125 160 171 64 11 0 6 24 72 32 25 |
-5(-23) = 115 -4(-36) = 144 -3(-53) = 159 -2(-26) = 52 -l(-5) = 5 0 111 = 11 218 = 36 333 = 99 410 = 40 56 = 30 |
3 10 20 9 14 11 9 8 6 6 1 3 |
-5 -4 -3 -2 0 1 2 3 4 5 6 |
-15 -40 -60 -18 -14 0 9 16 18 24 5 18 |
75 160 180 36 14 0 9 32 54 96 25 108 |
N = = 10 |
|
|
|
|
N = 100 |
|
|
|
Совпадение с данными о значениях и , найденных непосредственным вычислением, подтверждает правильность проведения упрощенных вычислений.
4) Определив значения трех
разностей:
можно записать,
что
и
Отсюда определяется коэффициент корреляции
Коэффициент регрессии у по х
Коэффициент регрессии х по у
Расхождения полученных коэффициентов с результатами непосредственных вычислений относятся к третьим десятичным знакам, что связано с приближенным характером вычислений.

u