
- •Раздел 1. Элементы теории вероятностей и математической статистики 2
- •Раздел 2. Основы проверки статистических гипотез 65
- •Раздел 1. Элементы теории вероятностей и математической статистики
- •1. Основные определения и теоремы
- •1.1. Предмет теории вероятности
- •1.2. Событие как результат испытания
- •1.3. Частость и вероятность. Классическое определение вероятности
- •1.4. Теорема сложения вероятностей
- •1.5. Теорема умножения вероятностей
- •2. Повторные независимые испытания
- •2.1. Биномиальное распределение вероятностей
- •2.2. Наивероятнейшее число появлений события
- •2.3. Асимптотическая формула биномиального распределения (локальная терема Лапласа). Формула Пуассона
- •2.4. Интегральная теорема Лапласа
- •Упражнения.
- •3. Случайная величина и ее числовые характеристики
- •3.1. Случайная величина и ее распределение
- •3.2. Математическое ожидание и его свойства
- •3.3. Дисперсия и среднее квадратическое отклонение
- •3.4. Нормальный закон распределения и понятие о теореме Ляпунова
- •4. Закон больших чисел
- •4.1. Неравенства Маркова и Чебышева
- •4.2. Теорема Чебышева
- •5. Основные сведения из математической статистики
- •5.1. Генеральная совокупность и выборка
- •5.2. Устойчивость выборочных средних
- •5.3. Определение параметров выборки с помощью теоремы Ляпунова
- •5.4. Понятие о доверительных границах для средних
- •5.5. Примеры математической обработки данных выборочного наблюдения
- •5.6. Понятие о критериях согласия
- •6. Элементы теории корреляции
- •6.1. Функциональная и корреляционная зависимости
- •6.2. Линейная корреляция.
- •6.3. Коэффициент корреляции
- •6.4. Упрошенный способ вычисления коэффициента корреляции
- •6.5. Простейшие случаи криволинейной корреляции
- •6.6. Понятие о множественной корреляции
- •Упражнения
- •Раздел 2. Основы проверки статистических гипотез
- •1. Статистические модели
- •2. Проверка статистических гипотез (общие положения)
- •3. Примеры статистических моделей и гипотез, ранги и ранжирование
- •4. Проверка статистических гипотез (прикладные задачи)
- •4.1. Схема испытаний Бернулли
- •4.2. Критерий знаков для одной выборки
- •5. Проверка гипотез в двухвыборочных задачах
- •5.1. Критерий Манна-Уитни
- •5.2. Критерий Уилкоксона
- •6. Парные наблюдения
- •6.1. Критерий знаков для анализа парных повторных наблюдений
- •6.2. Анализ повторных парных наблюдений с помощью знаковых рангов (критерий знаковых ранговых сумм Уилкоксона)
- •Список использованной литературы
- •Список рекомендуемой литературы
6.5. Простейшие случаи криволинейной корреляции
В некоторых случаях ломаная, соединяющая
точки, соответствующие парам значений
х и
располагается вблизи кривой. Ограничимся
рассмотрением корреляционной связи
для двух простейших кривых: параболы,
соответствующей трехчлену
,
и гиперболы, определяемой уравнением
1) Отыскание параметров квадратного трехчлена по способу наименьших квадратов с использованием данных простой таблицы значений х и у подробно разобрано выше.
Если же значения х и у представлены
данными корреляционной таблицы, то
корреляционная связь отыскивается как
уравнение регрессии
причем параметры этого уравнения
определяются из системы нормальных
уравнений, отражающих в структуре своих
коэффициентов и свободных членов все
данные корреляционной таблицы:
Заметим, что к выравниванию с помощью параболы второго порядка можно обращаться в тех случаях, когда использование линейной корреляции обнаруживает малую тесноту связи (значения коэффициента корреляции в границах 0,4 - 0,6).
В качестве примера применения способа наименьших квадратов для отыскания зависимости между у и х в форме уравнения параболы второго порядка используем уже рассмотренные выше данные табл. 6 группировки 135 сахаропесочных заводов по размеру основных производственных средств в млн. руб. (х) и по среднесуточной переработке свеклы в тыс. ц (у). Использование этих данных для установления параболической корреляционной зависимости целесообразно в связи с отмеченной выше малой теснотой линейной связи между рассматриваемыми показателями.
Для составления системы нормальных уравнений необходимые данные получаются суммированием, выполненным по схеме вспомогательной таблицы. Таблица 11
х |
|
|
|
|
|
|
|
|
1,75 2,25 2,75 3,25 3,75 4,25 |
21 42 25 24 13 10 |
36,75 94,50 68,75 78,00 48,75 42,50 |
64,31 212,63 189,06-253,50 182,81 180,63 |
112,55 478,38 520,00 823,92 685,49 767,70 |
196,97 1076,36 1430,00 2677,84 2570,28 3252,72 |
114 250 171 161 102 93 |
199,50 562,50 470,25 523,25 382,50 395,25 |
349,14 1139,06 1293,19 1700,56 1434,38 1679,81 |
|
N=135 |
369,25 |
1082,94 |
3388,04 |
11204,17 |
891 |
2533,25 |
7596,14 |
По итоговым данным табл. 11 можно записать систему нормальных уравнений:
Решение этой системы дает параметры:
2) Рассмотрим корреляционную
зависимость гиперболического типа,
определяемую уравнением
.
Пример 2. В табл. 12 дана группировка 44 предприятий по выпуску продукции в тыс. ед. (х) и средней себестоимости единицы в руб. (у). Составить корреляционное уравнение связи этими показателями.
х |
до 1 |
1-2 |
2-3 |
3-4 |
4-5 |
5-6 |
6-7 |
7-8 |
8-9 |
9-10 |
y |
16,50 |
13,75 |
13,31 |
12,50 |
13,52 |
12,75 |
12,30 |
12,83 |
12,28 |
12,34 |
Число предприятий |
6 |
6 |
8 |
7 |
4 |
4 |
3 |
2 |
2 |
2 |
Ломаная, отображающая данные этой таблицы (рис. 15), позволяет обратиться к уравнению гиперболы.
Рис. 15
Применим способ наименьших квадратов для определения пара метров искомого уравнения в виде .
Для функции
необходимые условия минимума
и
приводят к системе
Суммирование выполняется на вспомогательной таблице (табл. 13)
Таблица 13
x |
|
|
|
|
|
|
0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5
|
16.50 13.75 13.31 12.50 13.52 12.75 12.30 12.83 12. 28 12.34
|
6 6 8 7 4 4 3 2 2 2 |
12.000 4.000 3.200 2.000 0.888 0.728 0.462 0.266 0.236 0.210 |
24.000 2.664 1.280 0.574 0.196 0.132 0.072 0.036 0.028 0.022 |
99.00 82.50 100.48 87.50 54.08 51.00 36.90 25.66 24.56 24.68 |
198.000 55.000 40.192 24.100 12.178 9.273 5.677 3.421 2.889 2.591 |
|
|
N=44 |
23,990 |
29,004 |
586,36 |
353,301 |
Система нормальных уравнений
определяет параметры:
и
Отсюда искомое уравнение регрессии запишется так:
Соответствующая этому уравнению линия регрессии изображена вместе с ломаной на рис. 15.
Для измерения тесноты связи при линейной
корреляции введен коэффициент
корреляции. Общим измерителем тесноты
связи для всех случаев корреляции как
линейной, так и криволинейной служат
корреляционные отношения
.
Рассмотрим корреляционное отношение для корреляционной зависимости, выражаемой уравнением , которое устанавливает связь между частными средними , и соответственными значениями х.
В этом случае корреляционное отношение
(его символ )
определяется формулой
,
которая выражает отношение среднего
квадратического отклонения частных
средних
от общей средней у к среднему квадратическому
отклонению значений у от общей средней
.
Аналогично вводится понятие о
корреляционном отношении
с соответствующей формулой
3десь
означает среднее квадратическое
отклонение частных средних
от общей средней
,
а
— среднее квадратическое
отклонение значений х от
.
Это отношение в случаях линейной корреляции оказывается не меньше коэффициента корреляции, в чем можно убедиться на данных примера.
Ранее был найден коэффициент корреляции по формуле
.
При определении корреляционного
отношения из имеющихся данных для
вычисления r
используется значение
.
Следует определить еще
.
Но величина
,
выражающая дисперсию частных средних
значений
,
oпpeделяется в виде:
.
Здесь
Отсюда
и
Таким образом,
Ограничимся этим примером, опуская
общий вывод того, что в случаях линейной
корреляции значение корреляционного
отношения оказывается не меньше значения
коэффициента корреляции, т. е. что
.
При этом знак равенства возможен только в случаях точной корреляционной связи:
при точной линейной корреляционной
связи у по х
при точной линейной корреляционной
связи x по y
при точной линейной корреляционной
связи у по х, и x
по y.