- •Теория вероятностей и математическая статистика
- •Указания по выполнению контрольной работы
- •2. Варианты задач
- •2.1.4. Варианты задачи 1
- •Задача 2 теоремы сложения и умножения вероятностей. Формулы полной вероятности и байеса.
- •2.2.1. Основные понятия
- •2.2.2 Теорема сложения вероятностей несовместных событий
- •2.2.9. Варианты задачи 2
- •Задача 3
- •2.3.4. Варианты задачи
- •Задача 4
- •2.4.8. Варианты задачи 4.
- •Задача 5
- •2.5.4. Пример выполнения задачи 5
- •2.5.5. Варианты задачи 5
- •Задача 6 Точечные оценки параметров распределения
- •2.6.1. Выборочная средняя
- •Задача 7 Элементы теории корреляции регрессионного анализа
- •2.7.1. Отыскание параметров выборочного уравнения прямой линии регрессии
- •2.7.2. Оценка тесноты корреляционной зависимости
- •2.7.3. Свойства выборочного коэффициента корреляции
- •2.7.5. Нахождение коэффициента корреляции по корреляционной таблице
- •2.7.6. Пример выполнения задачи 7
- •2.7.7. Варианты задачи 7
- •Приложение
Задача 7 Элементы теории корреляции регрессионного анализа
Статистической называется зависимость, при которой изменение одной из величин влечет за собой изменение распределения другой.
Корреляционной зависимость Y от Х называется функциональная зависимость условной средней от Х, т.е.
=f(x), (*)
где условное среднее - это среднее арифметическое значение Y, соответствующее значению Х=х. Приведенное уравнение (*) называется уравнением регрессии, а функция f(x), называется регрессией Y на Х, а ее график – линией регрессии Y на Х.
Теория корреляции решает две задачи:
- установление формы корреляционной связи, т.е. вида функции регрессии;
- оценка тесноты корреляционной связи.
2.7.1. Отыскание параметров выборочного уравнения прямой линии регрессии
Для отыскания параметров выборочного уравнения прямой линией регрессии используются данные независимых экспериментов . Причем функция регрессии f(x) задается линейной относительно параметров регрессии, т.е. в случае парной регрессии
Для нахождения параметров используется метод наименьших квадратов. В случае линейной зависимости, т.е.
,
в соответствии с методом наименьших квадратов параметры a и b подбираются таким образом, чтобы функционал
Так как минимизация данного функционала требует дифференцирования его по каждой переменной, то это приводит к следующей системе уравнений:
;
.
После преобразования получается система двух линейных уравнений, в результате решения которых находятся параметры регрессии a и b.
Замечание 1. Рассмотренный способ нахождения оценок параметров а и b (метод наименьших квадратов) можно распространить на другие зависимости f(x): и другие.
2.7.2. Оценка тесноты корреляционной зависимости
Оценкой тесноты корреляционной зависимости является выборочный коэффициент корреляции.
,
где за обозначены выборочные среднеквадратические отклонения по X и по Y.
2.7.3. Свойства выборочного коэффициента корреляции
1. Абсолютная величина коэффициента не превосходит 1, то есть .
2. Если =0, то Y и Х не связаны линейной корреляционной зависимостью.
3. Если =1, то Y и Х связаны линейной корреляционной зависимостью.
4. С возрастанием абсолютного значения линейная корреляционная зависимость становится более тесной и при=1 переходит в функциональную зависимость.
Замечание 2. Коэффициент корреляции связан с коэффициентом линейной регрессии b зависимостью вида:
.
Интервальной оценкой выборочного коэффициента корреляции с надежностью называется доверительный интервал:
где n – объем выборки, а t – коэффициент, находимый по таблице функции Лапласа (см. прил., табл. 3) из соотношения . Формула используется при значительных объемах выборки.
2.7.5. Нахождение коэффициента корреляции по корреляционной таблице
Пусть эмпирические данные представлены в виде корреляционной таблицы табл. 6.
Таблица 6
X Y |
|
|
|
|
|
|
В таблице– значения признака X;– значения признака Y;– частота появления в выборке пары.
Тогда выборочный коэффициент корреляции может быть найден по формуле:
,
где n – сумма всех частот корреляционной таблицы (объем выборки).