Uch_Orlov_A_I_Ekonometrika_-_M_2002
.pdf
|
2.2.3. |
Эмпирическая |
Функция эмпирического распределения. |
Определена, когда результаты наблюдений - числа |
|
|
|
|
функция |
рас- |
|
или вектора (функции распределения по пп.1.2.2 и |
|
|
|
пределения |
|
1.3.2 соответственно). |
|
|
|
|
|
|
|
|
|
|
2.2.4. |
Выборочное |
Сумма результатов наблюдений, включенных |
Выборочное среднее арифметическое равно матема- |
|
|
|
|
среднее |
ариф- |
в выборку, деленная на ее объем. |
тическому ожиданию случайной величины, имеющей |
|
|
|
метическое |
|
эмпирическое распределение. |
|
|
|
|
|
|
|
|
|
|
2.2.5. |
Выборочная |
Сумма квадратов отклонений результатов на- |
Выборочная дисперсия |
|
|
|
|
дисперсия |
|
блюдений, включенных в выборку, от их вы- |
n |
|
|
|
|
|
борочного среднего арифметического, делен- |
s2 = 1/n ∑ (хi - xср)2-, |
|
|
|
|
|
ная на объем выборки. |
i=1 |
|
|
|
|
|
где x1, x2,...., xn - результаты наблюдений, включен- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ные в выборку; xср - выборочное среднее арифмети- |
|
|
|
|
|
|
ческое, |
|
|
|
|
|
|
n |
|
|
|
|
|
|
xср = 1/n ∑ хi. |
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
Выборочная дисперсия равна дисперсии случайной |
|
|
|
|
|
|
величины, имеющей эмпирическое распределение. |
|
|
|
|
|
|
|
|
|
2.2.6. |
Выборочное |
Неотрицательный квадратный корень из вы- |
|
|
|
|
|
среднее квадра- |
борочной дисперсии. |
|
|
|
|
|
тическое откло- |
|
|
|
|
|
|
нение |
|
|
|
|
|
|
|
|
|
|
|
|
2.2.7. |
Выборочный |
Момент порядка q случайной величины, |
n |
|
|
|
момент порядка |
имеющей эмпирическое распределение. |
mq = 1/n ∑ хiq, где хi по п.2.2.5. |
|
|
|
q |
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2.2.8. |
Выборочный |
Центральный момент порядка q случайной |
n |
|
|
|
центральный |
величины, имеющей эмпирическое распреде- |
mq = 1/n ∑ (хi - xср)q , где хi и xср по п.2.2.5. |
|
|
|
момент порядка |
ление. |
i=1 |
|
|
|
|
|
||
|
|
q |
|
|
|
|
|
|
|
|
|
|
2.2.9. |
k-я порядковая |
k-й элемент x(k) в вариационном ряду, полу- |
|
|
|
|
статистика |
ченном из выборки объема n, элементы кото- |
|
|
|
|
|
рой x1, x2,...., xn расположены в порядке не- |
|
|
|
|
|
убывания: x(1)≤x(2) ≤... ≤ x(k) ≤... ≤x(n). |
|
|
|
|
|
|
|
|
|
2.2.10. |
Размах выборки |
Разность между наибольшим и наименьшим |
Если x(1) и x(n) - первая и n-ая порядковые статистики |
|
|
|
|
значениями результатов наблюдений в выбор- |
в выборке объема n, то размах R = x(n) - x(1). |
|
|
|
|
ке. |
|
|
|
|
|
|
|
|
|
2.2.11. |
Выборочная |
Ковариация двумерного случайного вектора, |
Если (xi, yi), i=1,2,....,n, - результаты наблюдений, |
|
|
|
ковариация |
имеющего эмпирическое распределение. |
включенные в выборку, то выборочная ковариация |
|
|
|
|
|
n |
|
|
|
|
|
равна 1/n ∑ (хi - xср)(yi - yср), где хi и xср по |
|
|
|
|
|
i=1 |
|
|
|
|
|
n |
|
|
|
|
|
п.2.2.5, yср = 1/n ∑ yi. |
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
2.2.12. |
Выборочная |
Ковариационная матрица случайного вектора, |
На главной диагонали выборочной ковариационной |
|
|||||||
|
|
ковариационная |
имеющего эмпирическое распределение. |
матрицы стоят выборочные дисперсии по п.2.2.5, а вне |
|
|||||||
|
|
матрица |
|
|
главной |
диагонали |
- выборочные |
ковариации по |
|
|||
|
|
|
|
|
п.2.2.11. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
2.2.13. |
Выборочный |
Коэффициент корреляции двумерного слу- |
Выборочный коэффициент корреляции равен |
|
|||||||
|
|
коэффициент |
чайного вектора, имеющего |
эмпирическое |
|
|
∑(xi - xср )(yi - yср ) |
|
|
|
||
|
|
корреляции |
распределение. |
|
rn = |
|
|
|
|
|||
|
|
|
|
1≤i≤n |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
2 1/ 2 |
|
|
|
|
|
|
|
|
|
{ ∑(xi - xср ) |
∑(yi - yср ) } |
|
||||
|
|
|
|
|
|
|
1≤i≤n |
|
1≤i≤n |
|
|
|
|
|
|
|
|
где хi и xср по п.2.2.5, |
yi и yср по п.2.2.11. |
|
|||||
|
|
|
|
|
|
|||||||
|
2.2.14. |
Выборочная |
Корреляционная матрица случайного вектора, |
На главной диагонали выборочной корреляционной |
|
|||||||
|
|
корреляционная |
имеющего эмпирическое распределение. |
матрицы стоят 1, а вне главной диагонали - выбороч- |
|
|||||||
|
|
матрица |
|
|
ные коэффициенты корреляции по п.2.2.13. |
|
||||||
|
|
|
|
|
|
|||||||
|
2.2.15 |
Выборочный |
Отношение выборочного среднего квадрати- |
Выборочный коэффициент вариации используют, ко- |
|
|||||||
|
|
коэффициент |
ческого отклонения к выборочному среднему |
гда результаты наблюдений положительны. |
|
|||||||
|
|
вариации |
арифметическому. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2.3. Оценивание |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
2.3.1. |
Оценивание |
Приближенное определение |
интересующей |
Составляющими вероятностных моделей могут быть: |
|
||||||
|
|
|
специалиста составляющей |
вероятностной |
значение |
параметра |
распределения; |
характеристика |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
модели явления (процесса) по выборке. |
распределения (математическое ожидание, коэффици- |
|
|
|
ент вариации и др.); функция распределения; плот- |
|
|
|
ность вероятности; регрессионная зависимость, и т.д. |
|
|
|
|
2.3.2. |
Оценка |
Результат оценивания по конкретной выборке. |
Оценка является статистикой, а потому случайным |
|
|
|
элементом, в частных случаях - случайной величиной |
|
|
|
или случайным вектором. |
|
|
|
|
2.3.3. |
Точечное оце- |
Вид оценивания, при котором для оценивания |
|
|
нивание |
используется одно определенное значение. |
|
|
|
|
|
2.3.4. |
Доверительное |
Вид оценивания, при котором для оценивания |
Рассматриваемое множество лежит в пространстве |
|
оценивание |
используется множество. |
возможных состояний оцениваемой составляющей |
|
|
|
вероятностной модели явления (процесса). |
|
|
|
|
2.3.5. |
Доверительное |
Определяемое по выборке множество в про- |
Доверительное множество является случайным мно- |
|
множество |
странстве возможных состояний оцениваемой |
жеством. |
|
|
составляющей, используемое при доверитель- |
|
|
|
ном оценивании. |
|
|
|
|
|
2.3.6. |
Доверительная |
Вероятность того, что доверительное множе- |
В конкретных задачах оценивания для фиксированных |
|
вероятность |
ство содержит действительное значение оце- |
доверительных вероятностей строят соответствующие |
|
|
ниваемой составляющей. |
доверительные множества. |
|
|
|
|
2.3.7. |
Доверительный |
Доверительное множество, являющееся ин- |
Интервалы могут быть как ограниченными, так и не- |
|
интервал |
тервалом. |
ограниченными (лучами). |
2.3.8.Доверительные Концы (границы) доверительного интервала. границы
|
2.3.9. |
Верхняя |
дове- |
Граница доверительного интервала, являюще- |
Для доверительного интервала (-∞; a) верхней довери- |
|
|
|
рительная |
гра- |
гося лучом, не ограниченным снизу. |
тельной границей является число a. |
|
|
|
ница |
|
|
|
|
|
|
|
|
|
|
|
|
2.3.10. |
Нижняя |
дове- |
Граница доверительного интервала, являюще- |
Различие верхних, нижних и двусторонних довери- |
|
|
|
рительная |
гра- |
гося лучом, не ограниченным сверху. |
тельных границ необходимо учитывать при проведе- |
|
|
|
ница |
|
|
нии конкретных расчетов, т.к. часто все виды границ |
|
|
|
|
|
|
определяются с помощью одних и тех же таблиц. |
|
|
|
|
|
|
|
|
|
2.3.11. |
Двусторонние |
Границы ограниченного (и сверху, и снизу) |
Для двусторонних границ (T1;T2) с вероятностью 1 |
|
|
|
|
доверительные |
доверительного интервала |
справедливо неравенство T1≤T2. |
|
|
|
|
границы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2.4. Проверка статистических гипотез |
|
|
|
|
|
|
|
|
|
|
2.4.1. |
Статистическая |
Определенное предположение о свойствах |
|
|
|
|
|
гипотеза |
|
распределений случайных элементов, лежа- |
|
|
|
|
|
|
щих в основе наблюдаемых случайных явле- |
|
|
|
|
|
|
ний (процессов). |
|
|
|
|
|
|
|
|
|
|
2.4.2. |
Нулевая |
гипо- |
Статистическая гипотеза, подлежащая про- |
Из возможных статистических гипотез в качестве ну- |
|
|
|
теза |
|
верке по статистическим данным (результатам |
левой выбирают ту, прннятие справедливости которой |
|
|
|
|
|
наблюдений, вошедшим в выборку). |
наиболее важно для дальнейших выводов. |
|
|
|
|
|
|
|
|
|
2.4.3. |
Альтернативная |
Статистическая гипотеза, которая считается |
Сокращенная форма - альтернатива. |
|
|
|
|
гипотеза |
|
справедливой, если нулевая гипотеза неверна. |
|
|
|
|
|
|
|
|
|
|
2.4.4. |
Статистический |
Правило, по которому на основе результатов |
Принимаемое решение может однозначно определять- |
|
|
|
|
критерий |
|
наблюдений принимается решение о приня- |
ся по результатам наблюдений (нерандомизированный |
|
|
|
|
|
|
|
|
|
|
|
|
тии или отклонении нулевой гипотезы. |
критерий) или в некоторой степени зависеть от случая |
|
|
|
|
|
|
(рандомизированный критерий). |
|
|
|
|
|
|
|
|
|
2.4.5. |
Статистика |
Статистика, на основе которой сформулиро- |
Как правило, нерандомизированный статистический |
|
|
|
|
критерия |
|
вано решающее правило. |
критерий основан на статистике критерия, прини- |
|
|
|
|
|
|
мающей числовые значения. |
|
|
|
|
|
|
|
|
|
2.4.6. |
Критическая |
Область в пространстве возможных выборок |
Если статистический критерий основан на статистике |
|
|
|
|
область |
стати- |
со следующими свойствами: если наблюдае- |
критерия, то критическая область статистического |
|
|
|
стического кри- |
мая выборка принадлежит данной области, то |
критерия однозначно определяется по критической |
|
|
|
|
терия |
|
отвергают нулевую гипотезу (и принимают |
области статистики критерия. |
|
|
|
|
|
альтернативную), в противном случае ее при- |
Краткая форма: критическая область. |
|
|
|
|
|
нимают (и отвергают альтернативную). |
|
|
|
|
|
|
|
|
|
|
2.4.7. |
Критическая |
Множество чисел такое, что при попадании в |
Краткая форма: критическая область. |
|
|
|
|
область |
стати- |
него статистики критерия нулевую гипотезу |
|
|
|
|
стики критерия |
отвергают, в противном случае принимают. |
|
|
|
|
|
|
|
|
|
|
|
2.4.8. |
Критические |
Границы (концы) одного или двух интерва- |
Критическими значениями являются одно или два из |
|
|
|
|
значения |
|
лов, составляющих критическую область ста- |
чисел t1, t2 в случае, если критическая область имеет |
|
|
|
|
|
тистики критерия. |
вид {Tn<t1}, {Tn>t1} или {Tn<t1} {Tn>t2}, где Tn - |
|
|
|
|
|
|
статистика критерия. |
|
|
|
|
|
|
|
|
|
2.4.9. |
Ошибка |
перво- |
Ошибка, заключающаяся в том, что нулевую |
|
|
|
|
го рода |
|
гипотезу отвергают, в то время как в действи- |
|
|
|
|
|
|
тельности эта гипотеза верна. |
|
|
|
|
|
|
|
|
|
|
2.4.10. |
Уровень |
значи- |
Вероятность ошибки первого рода или точная |
Если нулевая гипотеза является сложной (например, |
|
|
|
|
|
|
|
|
|
|
мости |
|
верхняя грань таких вероятностей. |
задается с помощью множества параметров Θ0), то |
|
|
|
|
|
|
вероятность ошибки первого рода может быть не чис- |
|
|
|
|
|
|
лом (α), а функцией (α(θ0), θ0 Θ0). В качестве уровня |
|
|
|
|
|
|
значимости берут точную верхнюю грань значений |
|
|
|
|
|
|
указанной функции: |
|
|
|
|
|
|
α= sup α(θo). |
|
|
|
|
|
|
θo Θo |
|
|
|
|
|
|
|
|
|
2.4.11. |
Ошибка |
второ- |
Ошибка, заключающаяся в том, что нулевую |
|
|
|
|
го рода |
|
гипотезу принимают, в то время как в дейст- |
|
|
|
|
|
|
вительности эта гипотеза неверна (а верна |
|
|
|
|
|
|
альтернативная гипотеза). |
|
|
|
|
|
|
|
|
|
|
2.4.12. |
Мощность кри- |
Вероятность того, что нулевая гипотеза будет |
Мощность критерия является однозначной действи- |
|
|
|
|
терия |
|
отвергнута, если альтернативная гипотеза |
тельной функцией, определенной на составляющем |
|
|
|
|
|
верна. |
альтернативу множестве гипотез, заданном в конкрет- |
|
|
|
|
|
|
ной задаче статистической проверки гипотез, в част- |
|
|
|
|
|
|
ности, на параметрическом множестве, соответст- |
|
|
|
|
|
|
вующем альтернативным гипотезам. |
|
|
|
|
|
|
|
|
|
2.4.13. |
Функция |
мощ- |
Функция, определяющая вероятность того, |
Функция мощности критерия задана на множестве |
|
|
|
ности статисти- |
что нулевая гипотеза будет отклонена. |
всех гипотез, используемых в конкретной задаче ста- |
|
|
|
|
ческого |
крите- |
|
тистической проверки гипотез. Сужением ее на нуле- |
|
|
|
рия |
|
|
вую гипотезу является функция, задающая вероят- |
|
|
|
|
|
|
|
|
|
|
|
|
ность ошибки первого рода. Сужением ее на альтерна- |
|
|
|
|
|
тиву является мощность критерия. |
|
|
|
|
|
|
|
|
2.4.14. |
Оперативная |
Функция, определяющая вероятность того, |
Оперативная характеристика - дополнение до единицы |
|
|
|
характеристика |
что нулевая гипотеза будет принята. |
функции мощности статистического критерия. |
|
|
|
статистического |
|
|
|
|
|
критерия |
|
|
|
|
|
|
|
|
|
|
2.4.15. |
Критерий со- |
Критерий проверки гипотезы согласия, т.е. |
|
|
|
|
гласия |
того, что функция распределения результатов |
|
|
|
|
|
наблюдения, включенных в простую случай- |
|
|
|
|
|
ную выборку, совпадает с заданной или вхо- |
|
|
|
|
|
дит в заданное параметрическое семейство. |
|
|
|
|
|
|
|
|
|
2.4.16. |
Критерий одно- |
Критерий для проверки гипотезы о том, что |
Рассматривают также критерии независимости, сим- |
|
|
|
родности |
функции распределений результатов наблю- |
метрии, случайности, отбраковки и др. |
|
|
|
|
дений из двух или нескольких независимых |
|
|
|
|
|
простых случайных выборок совпадают (аб- |
|
|
|
|
|
солютная однородность) или отдельные их |
|
|
|
|
|
характеристики совпадают (однородность в |
|
|
|
|
|
смысле математических ожиданий, коэффи- |
|
|
|
|
|
циентов вариации и т.д.). |
|
|
|
|
|
|
|
|
|
2.4.17. |
Номинальный |
Число, используемое в статистических табли- |
Номинальный (заданный) уровень значимости обычно |
|
|
|
(заданный) уро- |
цах, с помощью которого выбирают критиче- |
берут равным 0,1; 0,05; 0,01. |
|
|
|
|
|
|
|
|
|
вень |
значимо- |
ское значение статистики критерия при про- |
|
|
|
|
|
сти |
|
|
верке статистической гипотезы. |
|
|
|
|
|
|
|
|
|
|
|
2.4.18. |
Реальный |
(ис- |
Уровень значимости статистического крите- |
Из-за дискретности распределения статистики крите- |
|
|
|
|
тинный) |
уро- |
рия, выбранного по номинальному уровню |
рия реальный уровень значимости может быть в не- |
|
|
|
|
вень |
значимо- |
значимости. |
сколько раз меньше номинального. |
|
|
|
|
сти |
|
|
|
|
|
|
|
|
|
|
|
||
|
2.4.19. |
Достигаемый |
Случайная величина, равная вероятности по- |
Для критической области вида {x:x>a} достигаемый |
|
||
|
|
уровень |
значи- |
падания статистики критерия в критическую |
уровень значимости есть F(Xn), где Xn - рассчитанное |
|
|
|
|
мости |
|
|
область, заданную рассчитанным по выборке |
по выборке значение статистики критерия X, а F(a) = |
|
|
|
|
|
|
значением статистики критерия. |
P(X>a) - дополнение до 1 функции распределения ста- |
|
|
|
|
|
|
|
тистики критерия X. Достигаемый уровень значимо- |
|
|
|
|
|
|
|
сти - это вероятность того, что статистика критерия Х |
|
|
|
|
|
|
|
в новом независимом эксперименте примет значение |
|
|
|
|
|
|
|
большее, чем при расчете по конкретной выборке, т.е. |
|
|
|
|
|
|
|
большее, чем Xn. |
|
|
|
|
|
|
|
||
|
2.4.20. |
Независимые |
Выборки, объединение элементов которых |
См. п.1.1.11. |
|
||
|
|
выборки |
|
моделируется набором независимых (в сово- |
|
|
|
|
|
|
|
|
купности) случайных элементов. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
П1-2. Математическая статистика и ее новые разделы
Приведем краткие описания (типа статей в энциклопедических изданиях) математической статистики и ее наиболее важных для эконометрики сравнительно новых разделов, разработанных в основном после 1970 г., а именно, статистики объектов нечисловой природы и статистики интервальных данных.
Статистика математическая - наука о математических методах анализа данных, полученных при проведении массовых наблюдений (измерений, опытов). В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы. Существенная часть статистики математической основана на вероятностных моделях.
Выделяют общие задачи описания данных, оценивания и проверки гипотез. Рассматривают и более частные задачи, связанные с проведением выборочных обследований, восстановлением зависимостей, построением и использованием классификаций (типологий) и др.
Для описания данных строят таблицы, диаграммы, иные наглядные представления, например, корреляционные поля. Вероятностные модели обычно не применяются. Некоторые методы описания данных опираются на продвинутую теорию и возможности современных компьютеров. К ним относятся, в частности, кластер-анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости, в наименьшей степени исказив расстояния между ними.
Методы оценивания и проверки гипотез опираются на вероятностные модели порождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что изучаемые объекты описываются функциями распределения, зависящими от небольшого числа (1-4) числовых параметров. В непараметрических моделях функции распределения предполагаются произвольными непрерывными. В статистике математической оценивают параметры и характеристики распределения (математическое ожидание, медиану, дисперсию, квантили и др.), плотности и функции распределения, зависимости между переменными (на основе линейных и непараметрических коэффициентов корреляции, а также параметрических или непараметрических оценок функций, выражающих зависимости) и др. Используют точечные и интервальные (дающие границы для истинных значений) оценки.
В статистике математической есть общая теория проверки гипотез и большое число методов, посвященных проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (т.е. о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.
Большое значение для эконометрики имеет раздел статистики математической, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.
Задачи восстановления зависимостей активно изучаются более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов. В настоящее время наиболее актуальны методы поиска информативного подмножества переменных и непараметрические методы.
Различные методы построения (кластер-анализ), анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без), автоматической классификации и др.