Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Uch_Orlov_A_I_Ekonometrika_-_M_2002

.pdf
Скачиваний:
28
Добавлен:
26.03.2016
Размер:
7.24 Mб
Скачать

 

2.2.3.

Эмпирическая

Функция эмпирического распределения.

Определена, когда результаты наблюдений - числа

 

 

 

функция

рас-

 

или вектора (функции распределения по пп.1.2.2 и

 

 

 

пределения

 

1.3.2 соответственно).

 

 

 

 

 

 

 

 

2.2.4.

Выборочное

Сумма результатов наблюдений, включенных

Выборочное среднее арифметическое равно матема-

 

 

 

среднее

ариф-

в выборку, деленная на ее объем.

тическому ожиданию случайной величины, имеющей

 

 

 

метическое

 

эмпирическое распределение.

 

 

 

 

 

 

 

 

2.2.5.

Выборочная

Сумма квадратов отклонений результатов на-

Выборочная дисперсия

 

 

 

дисперсия

 

блюдений, включенных в выборку, от их вы-

n

 

 

 

 

 

борочного среднего арифметического, делен-

s2 = 1/n (хi - xср)2-,

 

 

 

 

 

ная на объем выборки.

i=1

 

 

 

 

 

где x1, x2,...., xn - результаты наблюдений, включен-

 

 

 

 

 

 

 

 

 

 

 

 

ные в выборку; xср - выборочное среднее арифмети-

 

 

 

 

 

 

ческое,

 

 

 

 

 

 

n

 

 

 

 

 

 

xср = 1/n хi.

 

 

 

 

 

 

i=1

 

 

 

 

 

 

Выборочная дисперсия равна дисперсии случайной

 

 

 

 

 

 

величины, имеющей эмпирическое распределение.

 

 

 

 

 

 

 

 

2.2.6.

Выборочное

Неотрицательный квадратный корень из вы-

 

 

 

 

среднее квадра-

борочной дисперсии.

 

 

 

 

тическое откло-

 

 

 

 

 

нение

 

 

 

 

 

 

 

 

 

 

 

 

2.2.7.

Выборочный

Момент порядка q случайной величины,

n

 

 

 

момент порядка

имеющей эмпирическое распределение.

mq = 1/n хiq, где хi по п.2.2.5.

 

 

 

q

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

2.2.8.

Выборочный

Центральный момент порядка q случайной

n

 

 

 

центральный

величины, имеющей эмпирическое распреде-

mq = 1/n (хi - xср)q , где хi и xср по п.2.2.5.

 

 

 

момент порядка

ление.

i=1

 

 

 

 

 

 

 

q

 

 

 

 

 

 

 

 

 

 

2.2.9.

k-я порядковая

k-й элемент x(k) в вариационном ряду, полу-

 

 

 

 

статистика

ченном из выборки объема n, элементы кото-

 

 

 

 

 

рой x1, x2,...., xn расположены в порядке не-

 

 

 

 

 

убывания: x(1)x(2) ... x(k) ... x(n).

 

 

 

 

 

 

 

 

 

2.2.10.

Размах выборки

Разность между наибольшим и наименьшим

Если x(1) и x(n) - первая и n-ая порядковые статистики

 

 

 

 

значениями результатов наблюдений в выбор-

в выборке объема n, то размах R = x(n) - x(1).

 

 

 

 

ке.

 

 

 

 

 

 

 

 

 

2.2.11.

Выборочная

Ковариация двумерного случайного вектора,

Если (xi, yi), i=1,2,....,n, - результаты наблюдений,

 

 

 

ковариация

имеющего эмпирическое распределение.

включенные в выборку, то выборочная ковариация

 

 

 

 

 

n

 

 

 

 

 

равна 1/n (хi - xср)(yi - yср), где хi и xср по

 

 

 

 

 

i=1

 

 

 

 

 

n

 

 

 

 

 

п.2.2.5, yср = 1/n yi.

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

2.2.12.

Выборочная

Ковариационная матрица случайного вектора,

На главной диагонали выборочной ковариационной

 

 

 

ковариационная

имеющего эмпирическое распределение.

матрицы стоят выборочные дисперсии по п.2.2.5, а вне

 

 

 

матрица

 

 

главной

диагонали

- выборочные

ковариации по

 

 

 

 

 

 

п.2.2.11.

 

 

 

 

 

 

 

 

 

 

 

 

 

2.2.13.

Выборочный

Коэффициент корреляции двумерного слу-

Выборочный коэффициент корреляции равен

 

 

 

коэффициент

чайного вектора, имеющего

эмпирическое

 

 

(xi - xср )(yi - yср )

 

 

 

 

 

корреляции

распределение.

 

rn =

 

 

 

 

 

 

 

 

1in

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2 1/ 2

 

 

 

 

 

 

 

 

{ (xi - xср )

(yi - yср ) }

 

 

 

 

 

 

 

 

1in

 

1in

 

 

 

 

 

 

 

 

где хi и xср по п.2.2.5,

yi и yср по п.2.2.11.

 

 

 

 

 

 

 

 

2.2.14.

Выборочная

Корреляционная матрица случайного вектора,

На главной диагонали выборочной корреляционной

 

 

 

корреляционная

имеющего эмпирическое распределение.

матрицы стоят 1, а вне главной диагонали - выбороч-

 

 

 

матрица

 

 

ные коэффициенты корреляции по п.2.2.13.

 

 

 

 

 

 

 

 

2.2.15

Выборочный

Отношение выборочного среднего квадрати-

Выборочный коэффициент вариации используют, ко-

 

 

 

коэффициент

ческого отклонения к выборочному среднему

гда результаты наблюдений положительны.

 

 

 

вариации

арифметическому.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.3. Оценивание

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.3.1.

Оценивание

Приближенное определение

интересующей

Составляющими вероятностных моделей могут быть:

 

 

 

 

специалиста составляющей

вероятностной

значение

параметра

распределения;

характеристика

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

модели явления (процесса) по выборке.

распределения (математическое ожидание, коэффици-

 

 

 

ент вариации и др.); функция распределения; плот-

 

 

 

ность вероятности; регрессионная зависимость, и т.д.

 

 

 

 

2.3.2.

Оценка

Результат оценивания по конкретной выборке.

Оценка является статистикой, а потому случайным

 

 

 

элементом, в частных случаях - случайной величиной

 

 

 

или случайным вектором.

 

 

 

 

2.3.3.

Точечное оце-

Вид оценивания, при котором для оценивания

 

 

нивание

используется одно определенное значение.

 

 

 

 

 

2.3.4.

Доверительное

Вид оценивания, при котором для оценивания

Рассматриваемое множество лежит в пространстве

 

оценивание

используется множество.

возможных состояний оцениваемой составляющей

 

 

 

вероятностной модели явления (процесса).

 

 

 

 

2.3.5.

Доверительное

Определяемое по выборке множество в про-

Доверительное множество является случайным мно-

 

множество

странстве возможных состояний оцениваемой

жеством.

 

 

составляющей, используемое при доверитель-

 

 

 

ном оценивании.

 

 

 

 

 

2.3.6.

Доверительная

Вероятность того, что доверительное множе-

В конкретных задачах оценивания для фиксированных

 

вероятность

ство содержит действительное значение оце-

доверительных вероятностей строят соответствующие

 

 

ниваемой составляющей.

доверительные множества.

 

 

 

 

2.3.7.

Доверительный

Доверительное множество, являющееся ин-

Интервалы могут быть как ограниченными, так и не-

 

интервал

тервалом.

ограниченными (лучами).

2.3.8.Доверительные Концы (границы) доверительного интервала. границы

 

2.3.9.

Верхняя

дове-

Граница доверительного интервала, являюще-

Для доверительного интервала (-; a) верхней довери-

 

 

 

рительная

гра-

гося лучом, не ограниченным снизу.

тельной границей является число a.

 

 

 

ница

 

 

 

 

 

 

 

 

 

 

 

 

2.3.10.

Нижняя

дове-

Граница доверительного интервала, являюще-

Различие верхних, нижних и двусторонних довери-

 

 

 

рительная

гра-

гося лучом, не ограниченным сверху.

тельных границ необходимо учитывать при проведе-

 

 

 

ница

 

 

нии конкретных расчетов, т.к. часто все виды границ

 

 

 

 

 

 

определяются с помощью одних и тех же таблиц.

 

 

 

 

 

 

 

 

2.3.11.

Двусторонние

Границы ограниченного (и сверху, и снизу)

Для двусторонних границ (T1;T2) с вероятностью 1

 

 

 

доверительные

доверительного интервала

справедливо неравенство T1T2.

 

 

 

границы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.4. Проверка статистических гипотез

 

 

 

 

 

 

 

 

 

2.4.1.

Статистическая

Определенное предположение о свойствах

 

 

 

 

гипотеза

 

распределений случайных элементов, лежа-

 

 

 

 

 

 

щих в основе наблюдаемых случайных явле-

 

 

 

 

 

 

ний (процессов).

 

 

 

 

 

 

 

 

 

 

2.4.2.

Нулевая

гипо-

Статистическая гипотеза, подлежащая про-

Из возможных статистических гипотез в качестве ну-

 

 

 

теза

 

верке по статистическим данным (результатам

левой выбирают ту, прннятие справедливости которой

 

 

 

 

 

наблюдений, вошедшим в выборку).

наиболее важно для дальнейших выводов.

 

 

 

 

 

 

 

 

2.4.3.

Альтернативная

Статистическая гипотеза, которая считается

Сокращенная форма - альтернатива.

 

 

 

гипотеза

 

справедливой, если нулевая гипотеза неверна.

 

 

 

 

 

 

 

 

 

2.4.4.

Статистический

Правило, по которому на основе результатов

Принимаемое решение может однозначно определять-

 

 

 

критерий

 

наблюдений принимается решение о приня-

ся по результатам наблюдений (нерандомизированный

 

 

 

 

 

 

 

 

 

 

 

 

тии или отклонении нулевой гипотезы.

критерий) или в некоторой степени зависеть от случая

 

 

 

 

 

 

(рандомизированный критерий).

 

 

 

 

 

 

 

 

2.4.5.

Статистика

Статистика, на основе которой сформулиро-

Как правило, нерандомизированный статистический

 

 

 

критерия

 

вано решающее правило.

критерий основан на статистике критерия, прини-

 

 

 

 

 

 

мающей числовые значения.

 

 

 

 

 

 

 

 

2.4.6.

Критическая

Область в пространстве возможных выборок

Если статистический критерий основан на статистике

 

 

 

область

стати-

со следующими свойствами: если наблюдае-

критерия, то критическая область статистического

 

 

 

стического кри-

мая выборка принадлежит данной области, то

критерия однозначно определяется по критической

 

 

 

терия

 

отвергают нулевую гипотезу (и принимают

области статистики критерия.

 

 

 

 

 

альтернативную), в противном случае ее при-

Краткая форма: критическая область.

 

 

 

 

 

нимают (и отвергают альтернативную).

 

 

 

 

 

 

 

 

 

2.4.7.

Критическая

Множество чисел такое, что при попадании в

Краткая форма: критическая область.

 

 

 

область

стати-

него статистики критерия нулевую гипотезу

 

 

 

 

стики критерия

отвергают, в противном случае принимают.

 

 

 

 

 

 

 

 

 

2.4.8.

Критические

Границы (концы) одного или двух интерва-

Критическими значениями являются одно или два из

 

 

 

значения

 

лов, составляющих критическую область ста-

чисел t1, t2 в случае, если критическая область имеет

 

 

 

 

 

тистики критерия.

вид {Tn<t1}, {Tn>t1} или {Tn<t1} {Tn>t2}, где Tn -

 

 

 

 

 

 

статистика критерия.

 

 

 

 

 

 

 

 

 

2.4.9.

Ошибка

перво-

Ошибка, заключающаяся в том, что нулевую

 

 

 

 

го рода

 

гипотезу отвергают, в то время как в действи-

 

 

 

 

 

 

тельности эта гипотеза верна.

 

 

 

 

 

 

 

 

 

 

2.4.10.

Уровень

значи-

Вероятность ошибки первого рода или точная

Если нулевая гипотеза является сложной (например,

 

 

 

 

 

 

 

 

 

 

мости

 

верхняя грань таких вероятностей.

задается с помощью множества параметров Θ0), то

 

 

 

 

 

 

вероятность ошибки первого рода может быть не чис-

 

 

 

 

 

 

лом (α), а функцией (α(θ0), θ0 Θ0). В качестве уровня

 

 

 

 

 

 

значимости берут точную верхнюю грань значений

 

 

 

 

 

 

указанной функции:

 

 

 

 

 

 

α= sup α(θo).

 

 

 

 

 

 

θo Θo

 

 

 

 

 

 

 

 

 

2.4.11.

Ошибка

второ-

Ошибка, заключающаяся в том, что нулевую

 

 

 

 

го рода

 

гипотезу принимают, в то время как в дейст-

 

 

 

 

 

 

вительности эта гипотеза неверна (а верна

 

 

 

 

 

 

альтернативная гипотеза).

 

 

 

 

 

 

 

 

 

2.4.12.

Мощность кри-

Вероятность того, что нулевая гипотеза будет

Мощность критерия является однозначной действи-

 

 

 

терия

 

отвергнута, если альтернативная гипотеза

тельной функцией, определенной на составляющем

 

 

 

 

 

верна.

альтернативу множестве гипотез, заданном в конкрет-

 

 

 

 

 

 

ной задаче статистической проверки гипотез, в част-

 

 

 

 

 

 

ности, на параметрическом множестве, соответст-

 

 

 

 

 

 

вующем альтернативным гипотезам.

 

 

 

 

 

 

 

 

 

2.4.13.

Функция

мощ-

Функция, определяющая вероятность того,

Функция мощности критерия задана на множестве

 

 

 

ности статисти-

что нулевая гипотеза будет отклонена.

всех гипотез, используемых в конкретной задаче ста-

 

 

 

ческого

крите-

 

тистической проверки гипотез. Сужением ее на нуле-

 

 

 

рия

 

 

вую гипотезу является функция, задающая вероят-

 

 

 

 

 

 

 

 

 

 

 

 

ность ошибки первого рода. Сужением ее на альтерна-

 

 

 

 

 

тиву является мощность критерия.

 

 

 

 

 

 

 

 

2.4.14.

Оперативная

Функция, определяющая вероятность того,

Оперативная характеристика - дополнение до единицы

 

 

 

характеристика

что нулевая гипотеза будет принята.

функции мощности статистического критерия.

 

 

 

статистического

 

 

 

 

 

критерия

 

 

 

 

 

 

 

 

 

 

2.4.15.

Критерий со-

Критерий проверки гипотезы согласия, т.е.

 

 

 

 

гласия

того, что функция распределения результатов

 

 

 

 

 

наблюдения, включенных в простую случай-

 

 

 

 

 

ную выборку, совпадает с заданной или вхо-

 

 

 

 

 

дит в заданное параметрическое семейство.

 

 

 

 

 

 

 

 

 

2.4.16.

Критерий одно-

Критерий для проверки гипотезы о том, что

Рассматривают также критерии независимости, сим-

 

 

 

родности

функции распределений результатов наблю-

метрии, случайности, отбраковки и др.

 

 

 

 

дений из двух или нескольких независимых

 

 

 

 

 

простых случайных выборок совпадают (аб-

 

 

 

 

 

солютная однородность) или отдельные их

 

 

 

 

 

характеристики совпадают (однородность в

 

 

 

 

 

смысле математических ожиданий, коэффи-

 

 

 

 

 

циентов вариации и т.д.).

 

 

 

 

 

 

 

 

 

2.4.17.

Номинальный

Число, используемое в статистических табли-

Номинальный (заданный) уровень значимости обычно

 

 

 

(заданный) уро-

цах, с помощью которого выбирают критиче-

берут равным 0,1; 0,05; 0,01.

 

 

 

 

 

 

 

 

 

вень

значимо-

ское значение статистики критерия при про-

 

 

 

 

сти

 

 

верке статистической гипотезы.

 

 

 

 

 

 

 

 

 

 

2.4.18.

Реальный

(ис-

Уровень значимости статистического крите-

Из-за дискретности распределения статистики крите-

 

 

 

тинный)

уро-

рия, выбранного по номинальному уровню

рия реальный уровень значимости может быть в не-

 

 

 

вень

значимо-

значимости.

сколько раз меньше номинального.

 

 

 

сти

 

 

 

 

 

 

 

 

 

 

 

 

2.4.19.

Достигаемый

Случайная величина, равная вероятности по-

Для критической области вида {x:x>a} достигаемый

 

 

 

уровень

значи-

падания статистики критерия в критическую

уровень значимости есть F(Xn), где Xn - рассчитанное

 

 

 

мости

 

 

область, заданную рассчитанным по выборке

по выборке значение статистики критерия X, а F(a) =

 

 

 

 

 

 

значением статистики критерия.

P(X>a) - дополнение до 1 функции распределения ста-

 

 

 

 

 

 

 

тистики критерия X. Достигаемый уровень значимо-

 

 

 

 

 

 

 

сти - это вероятность того, что статистика критерия Х

 

 

 

 

 

 

 

в новом независимом эксперименте примет значение

 

 

 

 

 

 

 

большее, чем при расчете по конкретной выборке, т.е.

 

 

 

 

 

 

 

большее, чем Xn.

 

 

 

 

 

 

 

 

2.4.20.

Независимые

Выборки, объединение элементов которых

См. п.1.1.11.

 

 

 

выборки

 

моделируется набором независимых (в сово-

 

 

 

 

 

 

 

купности) случайных элементов.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

П1-2. Математическая статистика и ее новые разделы

Приведем краткие описания (типа статей в энциклопедических изданиях) математической статистики и ее наиболее важных для эконометрики сравнительно новых разделов, разработанных в основном после 1970 г., а именно, статистики объектов нечисловой природы и статистики интервальных данных.

Статистика математическая - наука о математических методах анализа данных, полученных при проведении массовых наблюдений (измерений, опытов). В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы. Существенная часть статистики математической основана на вероятностных моделях.

Выделяют общие задачи описания данных, оценивания и проверки гипотез. Рассматривают и более частные задачи, связанные с проведением выборочных обследований, восстановлением зависимостей, построением и использованием классификаций (типологий) и др.

Для описания данных строят таблицы, диаграммы, иные наглядные представления, например, корреляционные поля. Вероятностные модели обычно не применяются. Некоторые методы описания данных опираются на продвинутую теорию и возможности современных компьютеров. К ним относятся, в частности, кластер-анализ, нацеленный на выделение групп объектов, похожих друг на друга, и многомерное шкалирование, позволяющее наглядно представить объекты на плоскости, в наименьшей степени исказив расстояния между ними.

Методы оценивания и проверки гипотез опираются на вероятностные модели порождения данных. Эти модели делятся на параметрические и непараметрические. В параметрических моделях предполагается, что изучаемые объекты описываются функциями распределения, зависящими от небольшого числа (1-4) числовых параметров. В непараметрических моделях функции распределения предполагаются произвольными непрерывными. В статистике математической оценивают параметры и характеристики распределения (математическое ожидание, медиану, дисперсию, квантили и др.), плотности и функции распределения, зависимости между переменными (на основе линейных и непараметрических коэффициентов корреляции, а также параметрических или непараметрических оценок функций, выражающих зависимости) и др. Используют точечные и интервальные (дающие границы для истинных значений) оценки.

В статистике математической есть общая теория проверки гипотез и большое число методов, посвященных проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (т.е. о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.

Большое значение для эконометрики имеет раздел статистики математической, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.

Задачи восстановления зависимостей активно изучаются более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов. В настоящее время наиболее актуальны методы поиска информативного подмножества переменных и непараметрические методы.

Различные методы построения (кластер-анализ), анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без), автоматической классификации и др.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]