
- •Теория вероятностей и математическая статистика
- •Указания по выполнению контрольной работы
- •2. Варианты задач
- •2.1.4. Варианты задачи 1
- •Задача 2 теоремы сложения и умножения вероятностей. Формулы полной вероятности и байеса.
- •2.2.1. Основные понятия
- •2.2.2 Теорема сложения вероятностей несовместных событий
- •2.2.9. Варианты задачи 2
- •Задача 3
- •2.3.4. Варианты задачи
- •Задача 4
- •2.4.8. Варианты задачи 4.
- •Задача 5
- •2.5.4. Пример выполнения задачи 5
- •2.5.5. Варианты задачи 5
- •Задача 6 Точечные оценки параметров распределения
- •2.6.1. Выборочная средняя
- •Задача 7 Элементы теории корреляции регрессионного анализа
- •2.7.1. Отыскание параметров выборочного уравнения прямой линии регрессии
- •2.7.2. Оценка тесноты корреляционной зависимости
- •2.7.3. Свойства выборочного коэффициента корреляции
- •2.7.5. Нахождение коэффициента корреляции по корреляционной таблице
- •2.7.6. Пример выполнения задачи 7
- •2.7.7. Варианты задачи 7
- •Приложение
Задача 7 Элементы теории корреляции регрессионного анализа
Статистической называется зависимость, при которой изменение одной из величин влечет за собой изменение распределения другой.
Корреляционной
зависимость Y от Х называется функциональная
зависимость условной средней
от Х, т.е.
=f(x), (*)
где условное
среднее
- это среднее арифметическое значение
Y, соответствующее значению Х=х. Приведенное
уравнение (*) называется уравнением
регрессии, а функция f(x), называется
регрессией Y на Х, а ее график – линией
регрессии Y на Х.
Теория корреляции решает две задачи:
- установление формы корреляционной связи, т.е. вида функции регрессии;
- оценка тесноты корреляционной связи.
2.7.1. Отыскание параметров выборочного уравнения прямой линии регрессии
Для отыскания
параметров выборочного уравнения прямой
линией регрессии используются данные
независимых экспериментов
.
Причем функция регрессии f(x) задается
линейной относительно параметров
регрессии, т.е. в случае парной регрессии
Для нахождения параметров используется метод наименьших квадратов. В случае линейной зависимости, т.е.
,
в соответствии с методом наименьших квадратов параметры a и b подбираются таким образом, чтобы функционал
Так как минимизация данного функционала требует дифференцирования его по каждой переменной, то это приводит к следующей системе уравнений:
;
.
После преобразования получается система двух линейных уравнений, в результате решения которых находятся параметры регрессии a и b.
Замечание 1.
Рассмотренный
способ нахождения оценок параметров а
и b (метод наименьших квадратов) можно
распространить на другие зависимости
f(x):
и другие.
2.7.2. Оценка тесноты корреляционной зависимости
Оценкой тесноты корреляционной зависимости является выборочный коэффициент корреляции.
,
где за
обозначены выборочные среднеквадратические
отклонения по X и по Y.
2.7.3. Свойства выборочного коэффициента корреляции
1. Абсолютная
величина коэффициента не превосходит
1, то есть
.
2. Если
=0,
то Y и Х не связаны линейной корреляционной
зависимостью.
3. Если
=1,
то Y и Х связаны линейной корреляционной
зависимостью.
4. С возрастанием
абсолютного значения линейная
корреляционная
зависимость становится более тесной и
при
=1
переходит в функциональную зависимость.
Замечание 2.
Коэффициент
корреляции
связан с коэффициентом линейной регрессии
b зависимостью вида:
.
Интервальной
оценкой выборочного коэффициента
корреляции с надежностью
называется доверительный интервал:
где
n – объем выборки, а t – коэффициент,
находимый по таблице функции Лапласа
(см. прил., табл. 3) из соотношения
.
Формула используется при значительных
объемах выборки.
2.7.5. Нахождение коэффициента корреляции по корреляционной таблице
Пусть эмпирические данные представлены в виде корреляционной таблицы табл. 6.
Таблица 6
X Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В таблице–
значения признака X;
– значения признака Y;
– частота появления в выборке пары
.
Тогда выборочный коэффициент корреляции может быть найден по формуле:
,
где n – сумма всех частот корреляционной таблицы (объем выборки).