эконометрика для очно-заочного 4 курс 2024-2025 год / 04-УП Базовый курс эконометрики (Писарева О.М., Черников Г.В.) 2024
.pdf
Отметим, что функция плотности распределения f(x) случайной величины Х ~ N(m, σ2) с ростом |x| очень быстро убывает к 0. Теоретически X может принимать любые значения из интервала ( , ), однако реально значительно отклониться от m не может.
Таким образом, Х принимает значения лишь в окрестности m. Принято эту окрестность брать такой:
X (m 3 ,m 3 ) .
Посчитаем вероятность, что нормально распределенная случайная величина Х (с математическим ожиданием m и дисперсией σ2 окажется в интервале (m 3 ,m 3 ) .
Имеем:
P(m 3 X m 3 ) F(m 3 ) F(m 3 )
|
(m 3 ) m |
(m 3 ) m |
|
||||
= |
|
|
|
|
|
|
2 (3) . |
|
|
|
|||||
|
|
|
|
|
|||
Воспользовавшись таблицей функции Ф(t), получим следующий |
|||||||
результат: |
|
|
|
|
|
|
|
P(m 3 X m 3 ) ≈0,9973. |
|
|
|||||
Вероятность того, что X |
выйдет из интервала (m 3 ,m 3 ) равна 1 – |
||||||
0,9973=0,0027 – ничтожно малая величина; события с такими вероятностями практически нереализуемы11.
РАСПРЕДЕЛЕНИЕ χ2 (ХИ-КВАДРАТ)
Пусть X1, X2,..., Xn - взаимно независимые, нормально распределенные
случайные величины Xi ~ N(0, 1). Тогда сумма их квадратов имеет χ2- распределение c n степенями свободы:
2 (n) X12 X22 ... Xn2 .
Функция плотности распределения имеет вид:
kn (x) |
xn/2 1e x/2 |
, |
x 0, |
|
2x/2 Г(n / 2) |
||||
|
|
|
Г(t) – гамма-функция.
Математическое ожидание и дисперсия: М(Х) = n, D(X) = 2n.
11 Это утверждение составляет правило «трех сигм».
УТВЕРЖДЕНИЕ
Пусть две независимые случайные величины X и Y распределены по закону 2 (n) и 2 (m) , соответственно. Тогда их сумма X + Y распределена по закону 2 (n m).
Это утверждение отражает свойство воспроизводимости по параметру n, которое широко используется в статистике.
t-РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА
t-распределением Стьюдента с n степенями свободы называют
распределение случайной величины t |
|
|
, |
2 |
|
||
|
/ n |
||
где ξ ~ N(0,1) и 2 ~ 2 (n) - независимые случайные величины. Плотность распределения задается формулой:
|
|
|
|
n 1 |
|
|
|
|
1 |
|
|
Г |
|
|
|
sn (x) |
|
|
2 |
|
, |
x . |
|
n |
|
(1 x2 |
/ n)(n 1)/2 |
Г(n / 2) |
Представленное t-распределение Стьюдента используют для получения различных статистических выводов о среднем нормально распределённых случайных величин, когда дисперсия неизвестна.
РАСПРЕДЕЛЕНИЕ ФИШЕРА-СНЕДОКОРА
Пусть две случайные величины X и Y распределены по закону 2 (n) и2 (m), соответственно. Тогда их отношение
F(n,m) mX 22 (n) / n nY (m) / m
является случайной величиной, распределенной по закону Фишера-Снедокора S(n,m) с n (числитель) и m (знаменатель) – степенями свободы.
Это распределение широко применяется в статистике в частности при описании отношения выборочных дисперсий независимых нормально распределенных случайных величин.
Литература
1.Колемаев, В.А. Теория вероятностей и математическая статистика. Учебник / В.А. Колемаев, В.Н. Калинина. - М.: КноРус, 2017. - 304 c.
2.Гмурман, В.Е. Теория вероятностей и математическая статистика: Учебник для СПО / В.Е. Гмурман. - Люберцы: Юрайт, 2016. - 479 c.
3.Гмурман, В.Е. Руководство к решению задач по теории вероятностей и математической статистике: / В.Е. Гмурман. - М: Высшая школа, 2001. - 400 c.
4.Вентцель, Е.С. Теория вероятностей и ее инженерные приложения / Е.С. Вентцель, Л.А. Овчаров. - М.: Высшая школа, 2007. - 491 c.
5.Справочник по теории вероятностей и математической статистике / В.С. Королюк, Н.И. Портенко, А.В. Скороход, А.Ф. Турбин. – М. “Наука”. Главн.
ред. физ.-мат. лит. , 1985. – 640 с.
ГЛАВА 2. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
2.1. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Статистический эксперимент представляет собой получение, обработку и анализ данных. Объект статистического исследования можно рассматривать как случайную величину X, которая производит набор N12 своих значений (реализаций), составляющих генеральную совокупность объема N. Из этой совокупности особым образом выбирают n элементов – выборочную совокупность (или выборку) объема n N.
Задача статистики состоит в том, чтобы по выборке дать обоснованные заключения об исследуемых свойствах генеральной совокупности.
Выборочные значения ранжируют, т.е. сортируют одинаковые значения, например, по возрастанию, представляя их в виде пар
(хi, ni), i=1, …, k,
где xi называют вариантами, а ni – частотами.
Сумма всех частот равна объему выборки n:
k
ni n . i 1
Вместо выборочных частот иногда используют относительные частоты wi= ni/n. Очевидно, что в этом случае:
k
wi 1. i 1
Статистическим распределением выборки называют перечень вариант хi вариационного ряда и соответствующих им частот ni или относительных частот wi, i=1, …, k.
Статистическое распределение выборки также можно задать в виде последовательности интервалов, на которые разбит размах выборки
l = хmax – хmin
и соответствующих им частот (в качестве частоты интервала принимают сумму частот тех вариант, которые попали в этот интервал).
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основанием которых служат частичные интервалы длины h13,
а высоты равны отношению nhi – плотности частоты. Здесь ni – сумма частот
вариант, попавших в i-й интервал.
Следующий пример иллюстрирует построение гистограммы.
12Объем (т.е. количество элементов) может быть бесконечно большим числом.
13Обычно эти интервалы называют «карманами».
ПРИМЕР
Построим гистограмму для выборки, представленной таблицей:
|
xi |
|
1 |
|
2 |
3 |
|
4 |
5 |
|
|
ni |
|
13 |
|
5 |
20 |
|
5 |
7 |
|
Объем выборки: |
n ni |
13 5 20 5 7 50 . |
В |
нашем случае |
||||||
|
|
|
i |
|
|
|
|
|
|
|
величина интервала h = 1. Варианты xi лежат в интервале от 0,5 до 5,5, а высоты столбцов гистограммы соответствуют количеству «x» попавших в соответствующий «карман». Гистограмма представлена на рисунке 2.1.
Рисунок 2.1 – Иллюстрация гистограммы примера
Гистограмма относительных частот отличается от рассмотренной выше только маcштабом по оси ординат. Вместо частот ni здесь используются относительные частоты wi. Такая гистограмма представляет собой
эмпирическую функцию плотности распределения.
Для описания выборочных значений также применяют выборочную функцию распределения F*. Она представляет собой ступенчатую функцию, вычисляемую по формуле:
F*(x) wi , xi x
здесь суммирование производится только для тех частот wi, чьи варианты xi x .
ПРИМЕР
Из генеральной совокупности X извлечена выборка объема n = 50. Записать выборочную функцию распределения.
РЕШЕНИЕ
По определению F*(x) |
|
w , |
|
x x |
i |
|
i |
|
где wi – относительное число вариант, меньших x. Тогда:
а) при x ≤ 7, |
F*(x) = |
nx |
|
= |
0 |
= 0; |
|
||||||
|
|
|
n |
||||||||||
|
|
|
|
|
|
50 |
|
|
|
||||
б) при 7 < x ≤ 8, |
F*(x) = |
11 |
= 0,22; |
|
|||||||||
|
|
||||||||||||
|
|
50 |
|
|
|
|
|
|
|||||
в) при 8 < x ≤ 9, |
F*(x) = |
11 10 |
= 0,42; |
||||||||||
|
|||||||||||||
|
|
50 |
|
|
|
|
|
||||||
г) при 9 < x ≤ 10, |
F*(x) = |
11 10 15 |
= 0,72; |
||||||||||
|
|||||||||||||
|
|
|
|
|
|
|
|
50 |
|
|
|
|
|
д) при x > 10, |
F*(x) = |
11 10 15 14 |
= 1. |
||||||||||
|
|||||||||||||
|
|
|
|
|
|
|
|
50 |
|
|
|||
Таким образом, окончательно имеем: |
|||||||||||||
|
0 при х 7; |
|
|
|
|
|
|
||||||
|
0,22 при 7 |
х 8; |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|||||||
|
0,42 при8 |
х 9; |
|
|
|
|
|
|
|||||
F* (x) |
|
|
|
|
|
|
|||||||
0,72 при 9 |
х 10; |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 при х 10.
График соответствующей функции распределения проиллюстрирован на рисунке 2.2.
2.2. ВЫБОРОЧНЫЕ ХАРАКТЕРИСТИКИ СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ
Принято различать параметры статистического распределения, полученные по всей генеральной совокупности и по выборке. Первые называют генеральными, а вторые выборочными. Основные исследования и оценки производят по характеристикам выборки. С такими оценками в первую очередь относят статистические моменты, к ним относятся:
- начальный выборочный момент порядка m:
m |
|
1 xim |
|
1 ni xim ; |
|
|
n |
|
k |
|
|
n i 1 |
|
n i 1 |
- центральный выборочный момент порядка m:
m |
|
1 (xi 1 )m |
|
1 ni (xi 1 )m . |
|
|
n |
|
k |
|
|
n i 1 |
|
n i 1 |
Рисунок 2.2 – Иллюстрация графика функции распределения примера п.2.1
Качество получаемых оценок исследуемых параметров можно оценивать по следующим критериям:
1.Несмещенность. Полученная по выборке оценка a должна иметь математическое ожидание равное «истинному» значению исследуемого параметра а:
M (a) a .
2.Состоятельность. При увеличении числа испытаний или объема выборки, оценка a должна сходится по вероятности к значению a:
Lim P( a a ) 1,
n
где ε > 0 – произвольное малое число.
3. Эффективность. Среди всех возможных оценок a , данная имеет минимальную дисперсию: D( a ) → min.
ВЫБОРОЧНОЕ СРЕДНЕЕ
Среднее арифметическое всех выборочных значений или первый начальный момент – выборочное среднее:
x |
1 xi |
|
1 ni xi . |
|
n |
|
k |
|
n i 1 |
|
n i 1 |
Выборочное среднее является несмещенной, состоятельной и эффективной оценкой «истинного» математического ожидания генеральной совокупности: M(X).
ПРИМЕР.
Для данной выборки:
выборочное среднее можно оценить так:
x |
1 ni xi |
1 (11 7 10 8 15 9 14 10) 8,64. |
|
|
k |
|
|
|
n i 1 |
|
|
|
50 |
|
|
ВЫБОРОЧНАЯ ДИСПЕРСИЯ
Рассмотрим второй центральный выборочный момент:
2 |
|
1 (xi 1 )2 |
|
1 ni (xi 1 )2 |
|
|
n |
|
k |
|
|
n i 1 |
|
n i 1 |
Он может являться оценкой дисперсии генеральной совокупности D(X), но в таком виде он не удовлетворяет требованию несмещённости. Оценку дисперсии D(X) часто принимают в таком виде:
|
1 |
n |
|
|
1 |
k |
|
|
|
|
s2 |
(xi |
x)2 |
|
ni |
(xi |
x)2 |
– исправленная выборочная |
|||
|
|
|||||||||
|
n 1 i 1 |
|
|
n 1 i 1 |
|
|
|
|||
дисперсия. Она является несмещенной, состоятельной, но не эффективной оценкой для D(X).
ПРИМЕР
Для данных из предыдущего примера имеем:
s2 |
1 |
|
(11 (7 8,64)2 10 (8 8,64)2 15 (9 8,64)2 14 (10 8,64)2 ) |
|
50 1 |
||||
|
|
|||
= 1,256.
Заметим, что при больших объемах выборки исправленная дисперсия s2 мало отличается от «неисправленной».
ВЫБОРОЧНОЕ СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ
При оценке различных статистических параметров, особенно производных от нормально распределенных величин, опираются на значение
«исправленного» среднего квадратического отклонения. Получается оно из несмещенной оценки дисперсии по формуле:
s s2 |
|
1 (xi x)2 |
|
1 ni (xi x)2 |
||
|
|
|
n |
|
|
k |
|
|
n 1 |
i 1 |
|
n 1 |
i 1 |
ВЫБОРОЧНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ (ПИРСОНА)
Линейную зависимость двух случайных величин можно выявить по их выборочным значениям с помощью выборочного коэффициента корреляции Пирсона rxy. Вычисляется он следующим образом: пусть имеются две выборки
одинакового объема n: X={x1, x2, …,xn} |
и Y={y1, y2, …,yn}. |
||||||
Сначала вычислим средние выборочные значения и средние |
|||||||
квадратические отклонения по выборкам: |
|||||||
x |
1 xi , y |
1 yi , |
|
|
|
||
|
|
n |
n |
|
|
|
|
|
n i 1 |
n i 1 |
|
|
|
||
sx |
|
1 (xi |
x)2 |
и sy |
1 (yi y)2 . |
||
|
|
|
n |
|
|
|
n |
|
|
n 1 |
i 1 |
|
|
n 1 |
i 1 |
Далее, находим выборочную ковариацию:
Cov(X ,Y ) n1 1 n (xi x)( yi y) .
i 1
Выборочный коэффициент корреляции Пирсона вычисляется по формуле:
rxy Cov(X ,Y ) sx sy
или, в развернутом виде:
|
|
n |
|
|
|
|
rxy |
|
(xi |
x)( yi |
y) |
||
i 1 |
|
|
. |
|||
|
|
|
|
|
|
|
|
|
n |
|
n |
|
|
|
|
(xi |
x)2 ( yi y)2 |
|||
|
|
i 1 |
|
i 1 |
|
|
Коэффициент корреляции Пирсона rxy принимает значения в диапазоне от -1 до +1. Если rxy близок к 1, то говорят, что X и Y коррелированы, т.е. между ними обнаруживается сильная линейная связь. С другой стороны, если rxy ~ 0, то линейная зависимость между X и Y отсутствует14.
Отметим, что выборки из независимых генеральных совокупностей (т.е. из взаимно независимых случайных величин) – некоррелированны.
ПРИМЕР
Для представленных в таблице ниже наборов данных X и Y рассчитаем коэффициент корреляции rxy.
|
xi |
0,74 |
|
|
1,77 |
3,24 |
|
|
4,05 |
|
4,12 |
4,18 |
4,29 |
5,25 |
5,62 |
|
5,65 |
7,08 |
7,35 |
|||||
|
yi |
16,05 |
|
|
16,02 |
21,6 |
|
|
25,05 |
|
23,62 |
27,51 |
26,53 |
26,07 |
26,77 |
|
28,5 |
30,27 |
32,18 |
|||||
Имеем: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
x |
|
1 |
|
(0,74 1,77 ... 7,35) 4.445, |
y ... 25,014 , |
|
|
|
||||||||||||||
|
|
12 |
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
sx |
|
|
|
|
1 |
0,74 |
4,445 2 1,77 4,445 2 |
... 7,35 4,445 2 1,943, |
||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
11 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
sy ... 5,034 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
Исходя из этого, имеем: |
|
|
|
|
|
|
|
|
|
|
||||||||||||
Cov(X ,Y ) |
1 |
0,74 4,445 16,05 25,014 1,77 4,445 16,02 25,014 ... |
||||||||||||||||||||||
11 |
||||||||||||||||||||||||
7,35 4,445 32,18 25,014 9,337 . |
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
Окончательно вычисляем: |
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
r |
|
9,337 |
|
|
0,954 . |
|
|
|
|
|
|
|
|
|
||||||||
|
|
1,943 5,034 |
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
xy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
Полученное значение свидетельствует о наличии сильной линейной зависимости X и Y. Эта зависимость явно заметна, если соответствующие пары
14 Однако это не исключает существование нелинейной связи между X и Y.
