
- •Часть III Специальные разделы теории вероятностей и математической статистики Введение
- •§1. Случайные процессы (основные понятия)
- •§ 2. Цепи Маркова
- •§ 3. Двумерная случайная величина, ее распределение. Распределение каждой из компонент.
- •§ 4. Условные законы распределения вероятностей, составляющих дискретной, двумерной, случайной величин. Условное математическое ожидание. Условная дисперсия
- •§ 5. Корреляционная зависимость. Генеральный корреляционный коэффициент детерминации
- •§ 6. Линейная функция регрессии
- •§ 7. Однофакторный дисперсионный анализ
- •§ 8. Регрессионный анализ
- •8.1. Построение выборочного уравнения линейной регрессии по негруппированным данным. Выборочный коэффициент корреляции
- •8.2. Корреляционная таблица. Выборочное линейное уравнение регрессии по сгруппированным данным
- •Вопросы и задачи к части 3.
- •Список литературы Основная литература
- •Таблицы
§ 8. Регрессионный анализ
8.1. Построение выборочного уравнения линейной регрессии по негруппированным данным. Выборочный коэффициент корреляции
Рассматривается
опыт, который описывается случайными
величинами
и
.
В результатеп
независимых опытов поучается п
пар чисел
Возможна и другая модель: случайная
величина
описывает
входные данные опыта, а случайная
величина
отражает результат опыта. Входные данные
и результат эксперимента носят случайной
характер. Поэтому при условии
мы можем получить несколько значений
случайной величины
.
Условным
средним
называется среднее арифметическое
наблюдаемых значений
,
соответствующих
пример
1. Случайная
величина Х показывает рост человека, а
- его вес. Дана выборка зависимых случайных
величин
и
:
|
160 |
165 |
160 |
170 |
160 |
165 |
170 |
155 |
160 |
|
70 |
60 |
65 |
80 |
70 |
75 |
80 |
85 |
60 |
Найти условные средние.
В выборке значение
встречалось четыре раза:
Тогда
Значение
встречается в выборке два раза:
Тогда
.
Значение
встречается в выборке два раза
Тогда
Значение
встречается в выборке только один раз.
Поэтому
Условное среднее
является функцией отх:
Это уравнение
называется выборочным
уравнением регрессии
на
.
Порой рассматривается
зависимость случайной величины
от
.
Условным средним
называется среднее значение наблюдаемых
,
соответствующих
Условное среднее
является функцией оту,
а функция
называетсявыборочным
уравнением регрессии
на
.
Предполагается,
что уравнение регрессии
является линейным:
В результате п опытов получена выборка
Нужно найти линейное выборочное уравнение
регрессии
на
в виде
Величины
и
являются оценками величин
и
Рассматривается сумма
Оценки величин
и
определяются из условия минимальности
записанной суммы. Используется алгоритм
нахождения точек экстремума функции
двух переменных. Получаем:
Располагая результатами наблюдений можно не знать вида функции регрессии. При определенных условиях на проведение эксперимента по данным выборки можно проверить гипотезу о линейности функции регрессии:
Приведем оценки
величин, входящих в линейное уравнение
регрессии. Дана выборка случайных
величин
и
:
Объем выборки равен п.
Мы уже рассматривали несмещенные оценки математических ожиданий:
Приведем смещенные состоятельные оценки дисперсий:
Приведем оценку корреляционного момента:
Эта величина
называется выборочным
корреляционным моментом. По
значению
определяетсявыборочный
коэффициент корреляции.
где
и
оценки среднеквадратических отклонений.
С использованием введенных оценок можно записать выборочное уравнение регрессии:
Пример
2. Записать
выборочное уравнение
на
и найти выборочный коэффициент корреляции
по данным выборки.
|
65 |
71 |
82 |
65 |
63 |
60 |
63 |
66 |
65 |
70 |
|
72,9 |
48,4 |
65,3 |
64 |
62,7 |
75,5 |
72,8 |
50,6 |
40,8 |
50 |
Объем выборки
.
Находим среднее арифметическое выборочных значений:
Для вычисления
значений
и
удобно использовать следующую таблицу
8.1.1.
Таблица 8.1.1.
|
|
|
|
|
|
|
|
1 |
65 |
72,9 |
4738,9 |
42225 |
-2 |
10,6 |
21,2 |
2 |
71 |
48,4 |
3436,4 |
5041 |
4 |
-13,9 |
55,6 |
3 |
82 |
65,3 |
5354,6 |
6724 |
15 |
3 |
45 |
4 |
65 |
64 |
4160 |
4225 |
-2 |
1,7 |
-3,4 |
5 |
63 |
62,7 |
3950,1 |
3969 |
-4 |
0,4 |
-1,6 |
6 |
60 |
75,5 |
4530 |
3600 |
7 |
13,2 |
92,4 |
7 |
63 |
72,8 |
4586,4 |
3969 |
-4 |
10,5 |
-42 |
8 |
66 |
50,6 |
3339,6 |
4356 |
-1 |
-11,7 |
11,7 |
9 |
65 |
40,8 |
2652 |
4225 |
-2 |
-21,5 |
43 |
10 |
70 |
50 |
3500 |
4900 |
3 |
-12,3 |
-36,9 |
Сумма |
670 |
623 |
40248 |
45234 |
- |
- |
185 |
Найдем оценки
и
:
Запишем выборочное
линейное уравнение регрессии
на
.
Найдем оценку корреляционного момента:
Найдем оценки дисперсий
Найдем выборочный коэффициент корреляции: