
- •Тезисы лекций Тема №1. Случайные события
- •Перечень вопросов, выносимых для рассмотрения:
- •Функция распределения обладает следующими свойствами:
- •Основные свойства плотности распределения:
- •Вопросы для самопроверки:
- •Вопросы для самопроверки:
- •Тема №7. Элементы теории корреляции
- •Перечень вопросов, выносимых для рассмотрения:
- •Вопросы для самопроверки:
- •14 Список рекомендуемой литературы Основная:
- •Дополнительная:
Вопросы для самопроверки:
Что называется статистической оценкой неизвестного параметра?
Какие требования предъявляются к статистическим оценкам?
Какая оценка называется несмещенной?
Какая оценка называется эффективной?
Какая оценка называется состоятельной?
Дайте определения генеральной и выборочной средних. Как они вычисляются?
Как вычисляются генеральная и выборочная дисперсии?
Как определяется несмещенная выборочная дисперсия?
Какие оценки называются точечными?
Какие оценки называются интервальными?
Что называется доверительным интервалом?
Как определяется доверительный интервал для математического ожидания а нормального распределения?
Тема №7. Элементы теории корреляции
Цель лекции: Познакомить студентов с формами зависимости между случайными величинами в условиях неопределенности и научить оценивать тесноту связи между этими величинами.
Перечень вопросов, выносимых для рассмотрения:
Различные формы зависимости между случайными величинами.
Выборочное уравнение регрессии.
Выборочное уравнение прямой линии среднеквадратичной регрессии.
Корреляционная таблица.
Коэффициент корреляции.
Рассмотрим систему двух случайных величин Х и У, одна из которых независимая (факторный признак) Х, а другая – зависимая (результативный признак) У.
Две случайные величины могут быть связаны функциональной или статистической зависимостью, или быть независимыми. Функциональная зависимость реализуется редко, т.к. рассматриваемые случайные величины могут подвергаться действию других случайных факторов, среди которых могут быть и общие для обеих величин. Поэтому чаще возникает статистическая зависимость.
Определение. Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой.
Определение. Статистическая зависимость, проявляющаяся в том, что при изменении одной из величин изменяется среднее значение другой, называется корреляционной.
Пример: Х- количество удобрений, внесенных на 1 га; У - урожайность.
С одинаковых по площади участков земли при равных количествах внесенных удобрений снимают различный урожай, т.е. У не является функцией Х. Однако, средняя урожайность увеличивается с увеличением количества удобрений, т.е. среднее значение урожайности является функцией Х.
Важной статистической характеристикой системы двух зависимых величин является условная средняя.
Определение.
Условным
средним
называется среднее арифметическое
наблюдаемых значений величины У,
соответствующих Х= х.
Аналогично,
условным средним
называется среднее арифметическое
наблюдаемых значений величины Х,
соответствующих У=у.
Условная
средняя
зависит от наблюдаемых значений величины
Х, т.е.
является функцией от х. Обозначив ее
через
,
получим уравнение
= (1)
Определение. Уравнение вида = называется выборочным уравнением регрессии У на Х, а функция - выборочной функцией регрессии У на Х.
График выборочной функции регрессии называется выборочной линией регрессии.
Рассмотрим линейную функцию регрессии, которая соответствует равномерному развитию социально-экономических явлений.
Пусть
исследуется система количественных
признаков (Х,У), где Х –факторный признак
(независимая случайная величина), У-
результативный признак (зависимая
случайная величина). В результате
независимых опытов получены
пар чисел: (х1,
у1),
(х2,
у2),
. . . , (х n
, уn
). Уравнение регрессии У на Х будем
искать в виде
=
.
Угловой коэффициент прямой линии
регрессии У на Х называется выборочным
коэффициентом регрессии У на Х и
обозначается
.
Т.о. выборочное уравнение прямой линии регрессии У на Х имеет вид
=
+
(2)
Параметры уравнения
и
находим применяя «принцип наименьших
квадратов»,
суть которого заключается в следующем:
сумма квадратов отклонений значений
величины У, вычисленных по уравнению
(2), от наблюдаемых значений
должна быть минимальной. В результате
получаем:
,
b
=
,
где
,
,
и
- средние значения.
Аналогично можно найти выборочное уравнение прямой линии регрессии Х на У.
=
При большом числе наблюдений одно и то же значение величины Х или величины У, а также пара значений (х,у) может наблюдаться несколько раз. Пусть nx раз наблюдается значение х, ny раз – значение у, а nxy раз – пара (х,у). В таких случаях данные наблюдений группируют и записывают в виде таблицы, которую называют корреляционной.
Тесноту связи между случайными величинами Х и У характеризуют с помощью корреляционного момента и коэффициента корреляции.
Определение.
Корреляционным
моментом
двух случайных величин Х и У называется
математическое ожидание произведения
отклонений этих величин от их математических
ожиданий.
= М{[X – M(У)] [У – М(У)]}
Определение.
Коэффициентом
корреляции
случайных величин Х и У называется
отношение корреляционного момента к
произведению средних квадратических
отклонений этих величин.
Величина коэффициента корреляции не зависит от выбора единиц измерения случайных величин.
Можно показать, что абсолютная величина коэффициента корреляции не превышает единицы:
1
Если
, то случайные величины Х и У независимы.
Если = 1, то связь между ними функциональная.
При других значениях связь корреляционная.
Для качественной оценки тесноты связи применяется шкала Чеддока:
|
0,1 - 0,3 |
0,3 - 0,5 |
0,5 - 0,7 |
0,7 - 0,9 |
более 0,9 |
Характеристика связи |
слабая |
умеренная |
заметная |
высокая |
весьма высокая |
Коэффициент
корреляции, найденный по данным
выборочного наблюдения признаков Х и
У называется выборочным коэффициентом
корреляции
.
При прямолинейной форме связи между Х и У выборочный коэффициент корреляции определяется по формуле