- •Математическая статистика
- •Исходные статистические данные и понятия выборки.
- •Основное требование к выборке.
- •Эмпирический закон распределения дискретных случайных величин
- •Эмпирическая функция распределения
- •Гистограмма
- •Полигон частот
- •Средняя арифметическая вариационного ряда
- •Дисперсия вариационного ряда, ее свойства
- •Правило сложения дисперсий
- •Точечные оценки неизвестных параметров распределения
- •Состоятельность и несмещенность оценок
- •Оценка для математического ожидания и дисперсии
- •Оценивание параметров распределения
- •Интервальные статистические оценки.
- •Основы теории выборочного метода
- •Собственная случайная величина для определения доли
- •Собственно-случайная выборка для определения средней
- •Проверка статистических гипотез.
- •Построение критерия проверки статистической гипотезы.
- •Понятие о критериях согласия.
- •Элементы теории корреляции
- •Общая средняя.
- •Линейная корреляционная зависимость.
- •Составление уравнений прямых регрессий
- •Не линейные корреляционные зависимости
- •Гиперболическая регрессия
- •Показательная корреляционная зависимость
- •Понятие о коэффициенте корреляции и корреляционных отношениях
- •Корреляционные отношения
- •Свойства коэффициента корреляции и корреляционных отношений
- •Свойства корреляционных отношений
- •Понятие множественной корреляции
- •Свойства совокупного коэффициента
Линейная корреляционная зависимость.
Линейная корреляционная зависимость- это вид линейной зависимости , корреляционная зависимость между x и y . При нахождении корреляционной зависимости на подвергается анализу расположение точек на числовой плоскости, после выбора функции
;
.
Задача
сводится к нахождению параметров искомой
функции по данным корреляционной
таблицы. Наиболее важные - линейные
зависимости. Рассмотрим и зависимость
y
на x
. В прямоугольной системе координат
построим точки
.
Предположим, что между переменными x
и y
существует линейная корреляционная
зависимость y
на x
.
Искомой
прямой служит та, которая в смысле
принципа наименьших квадратов ближе
других расположена к точкам A1,A2,…,As
,причем т. A1
учитывается nx1
-раз ,т.е. сколько раз встречаются в
распределении соответствующие значения
xi.
Прямая CD, ее уравнение y=ax+b.
Возьмем на CD точки, обозначим их со
штрихами
- имеющие с точками A1,A2,…,As
одинаковые абсциссы. Согласно метода
наименьших квадратов, найдем сумму
квадратов разностей ординат соответствующих
точкам
Следовательно, S- сумма двух независимых переменных a и b . Для искомой прямой сумма минимальна, используя необходимые условия экстремумов функций , т.е обращение в 0 ее первых частных производных.
(1)
;
.
Разделим оба уравнения на объем совокупности n:
;
;
-общая
средняя;
.
Возьмем
слагаемое
,
вместо
подставим сумму
-это
есть средняя арифметическая переменных
и
.
(2)
Из
1-го уравнения выразим b;
И подставим b:
;
(3)
Это
уравнение- это прямая регрессии y
на x
проходит через точку
. Причем точка
- это средняя точка корреляционного
графика , коэффициент в уравнении прямой
регрессии называется коэффициентом
регрессии y
на x
и обозначается как
(4) .
Найдем
из системы (2).
Подставим во 2-ое уравнение:
(5)
Знаменатель
- это дисперсия переменной x
относительно ее общей средней
.
(6)
Аналогично
можно составит уравнение прямой регрессии
x
на y
. Для этого в прямоугольной плоскости
координат отмечают точки Cj
с координатами
.
Проводя аналогичные рассуждения мы
получаем формулы для параметров c
и d
для уравнения x=cy+d
, и уравнение искомой прямой регрессии
x
на y
запишется в виде
(7)
-называется
коэффициентом регрессии x
на y
и определяется также по формуле (5)
или
;
(8)
Отметим свойства коэффициентов регрессии.
1. Коэффициенты регрессии y на x и x на y имеют одинаковые знаки. Знаменатель всегда положительный , поэтому эти знаки определяются числителями.
2. Коэффициент регрессии y на x является условным коэффициентом прямой регрессии y на x , а коэффициент регрессии x на y величиной обратной угловому коэффициенту прямой регрессии x на y , из уравнений (4) и (7).
Составление уравнений прямых регрессий
Для того, чтобы найти уравнения (4) и (7), необходимо вычислить общие средние переменных x и y , а также коэффициенты регрессии. Вычисление и и дисперсий можно вести одновременно если использовать формулы:
;
;
;
;
Где c,c,k,k -произвольные постоянные.
Пример: для таблицы №1 составить уравнение корреляционной зависимости между количеством внесенных удобрений и урожайностью.
c=50;k=20
|
|
xi-c |
|
|
|
10 30 50 70 |
14 23 28 35 |
-40 -20 0 20 |
-2 -1 0 1 |
-28 -23 0 35 |
56 23 0 35 |
Итого: |
|
|
|
-16 |
114 |
c=14;k=2
yj |
nyj |
yj-c |
|
|
|
10 12 14 16 18 20 |
10 16 17 27 24 6 |
-4 -2 0 2 4 6 |
-2 -1 0 1 2 3 |
-20 -16 0 27 48 18 |
40 16 0 27 96 54 |
Итого: |
|
|
|
57 |
233 |
|
yj |
10 |
12 |
14 |
16 |
18 |
20 |
|
xi
|
|
-2 |
-1 |
0 |
1 |
2 |
3 |
|
10 30 50 70 |
-2 -1 0 1 |
9 1 - - |
4 10 2 - |
1 9 6 1 |
- 3 14 10 |
- - 6 18 |
- - - 6 |
44 9 0 64 |
|
8 |
38 |
18 |
0 |
7 |
36 |
11 |
117 |
;
;
;
;
Уравнение запишем:
y-15,4=0,113(x-46,8);
y=0,113x+9,852;
x-46,8=6,29(y-15,4);
x=6,29y-48,431;
