Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2_semestr / статистика / Statistika_lekcii.doc
Скачиваний:
34
Добавлен:
15.04.2015
Размер:
1.09 Mб
Скачать

3. Ошибки выборки

Различают следующие ошибки выборки:

              1. Ошибки регистрации, которые бывают преднамеренными и непреднамеренными.

              2. Ошибки репрезентативности, которые делятся на случайные и систематические. Систематическая ошибка связана с плохой системой отбора или с ее нарушением. Случайные ошибки зависят от трех основных факторов:

  • от объема выборки,

  • от степени вариации изучаемого признака генеральной в совокупности, которая характеризуется генеральной дисперсией,

  • от применяемого способа отбора и единиц отбора.

Простая случайная повторная выборка: согласно теории Ляпунова, при достаточно большом , конечноми ограниченнойвероятность того, что расхождение, не превзойдет величиныравна функции интеграла Лапласа, т.е., где

- стандартная ошибка,

- предельная ошибка.

В математике доказано, что где, т.е.. Таким образом, с заданной вероятностьюможно утверждать, что.

Для альтернативной выборочной стандартная ошибка находится по формуле:

Задача обратная определению ошибки выборки - это определение объема выборки. Объем выборки можно выявить из формулы определения стандартной ошибки: .

Если известны крайние значения , то для симметричной выборки, для асимметричной размах делится на 5. Для доли берется максимальное значение., гдеизменяется от 0 до 1. При этом

4. Влияние вида выборки на величину ошибки выборки

Для бесповторной выборки производится коррекция стандартной ошибки . Для альтернативной случайной величины. Аналогичная коррекция производится при механическом отборе, т.к. если генеральная совокупность не ранжируется , то это будет разновидность простой случайной бесповторной выборки. Для типической выборки генеральная совокупность разбивается на к групп., коррекция,- средняя из внутригрупповых дисперсий.

, - внутригрупповая дисперсия.

Аналогично для альтернативной случайной величены:

;.

Для серийной выборки , где- межсерийная дисперсия.

, ,.

Особое место занимает малая выборка. Теория малой выборки разработана английским статистиком Стъюдентом. Он построил специальное распределение, соотносящее t и доверительную вероятность F(t). При таблица распределения Стъюдента дает те же результаты, что и таблицы интеграла вероятности Лапласа. Приразличия незначительны и при, необходимо пользоваться распределением Стъюдента.

, где - коэффициент, который зависит от объема выборки.

Распределение зависит от числа степеней свободы дисперсии. По сравнению с нормальным распределением пристандартная ошибка увеличивается, следовательно, увеличивается и предельная ошибка, и доверительный интервал при той же доверительной вероятности.

5. Проверка статистических гипотез

Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Гипотеза о распределениях параметров генеральной совокупности называется параметрической. Гипотеза о законах распределениях называется непараметрической. Гипотеза о том, что две совокупности сравнимые по одному или нескольким параметрам ничем не отличаются называется нулевой.

Правила, устанавливающие условия отклонения или принятия нулевой гипотезы, называется статистическим критерием.

Этапы проверки статистических гипотез:

  • формулировка гипотезы,

  • выборы статистического критерия,

  • определение области допустимых значений и критических точек, которые разделяют область допустимых значений и определение критической области по соответствующим таблицам,

  • вычисление фактического значения статистического критерия,

  • проверка гипотезы на основе сравнения фактического и критического значения.

Возможны два ошибочных решения:

        1. Неправильное отклонение нулевой гипотезы (ошибка первого рода), ее вероятность или риск называется уровень значимости критерия.

        2. Неправильное принятие нулевой гипотезы или ошибки второго рода, ее вероятность или риск .

-называется мощностью критерия.

Проверка соответствия теоретического и эмпирического распределения производится при помощи критериев согласия, наиболее распространены из которых это - критерий Пирсона и Колмогорова. По ряду распределения строится гистограмма, вычисляются различные величины и на их основе подбирается тот или иной закон.

Критерий Пирсона проверяет гипотезу о том, что случайная выборка извлечена из генеральной совокупности с функцией распределения, вид которой известен, а параметры неизвестны.

Этапы проверки гипотезы по критерию Пирсона.

  • Совокупность преобразуется в интервальный ряд, который имеет к интервалов.

  • На основе сгруппированных данных вычисляются оценки неизвестных параметров теоретического распределения.

  • Определяют вероятность попадания случайной величиныв к-тый интервал.

  • Вычисляется значение критерия Пирсона - чем меньше критерий, тем ближе фактическое распределение к теоретическому.

Критерий Пирсона сравнивается с табличным значением, найденного для уровня значимости и числа степеней свободы, где- число параметров закона распределения. Если полученное значение критерия больше критического, то нулевая гипотеза отвергается.

Критерий Колмогорова проверяет гипотезу о том, что случайная выборка извлеченная из генеральной совокупности с непрерывной функцией распределения, которая полностью определена, т.е. не зависит от неизвестных параметров.

, т.е. максимальный модуль отклонения эмпирической функции распределения от теоретической. Если данный критерий больше критического значения, то нулевая гипотеза отвергается.

Проверка гипотезы о средних:

1. , в качестве критерия используется критерий Стюарта,. Если значение- критерия большекритического, то нулевая гипотеза отвергается.

2.

Проверка гипотезы о дисперсиях

Проверка проводится с помощью критерия Фишера. . Критическое значение данного критерия зависит от уровня значимостии числа степеней свободы числителя и знаменателя. Если значение критерия Фишера больше критического, то нулевая гипотеза отвергается.

Соседние файлы в папке статистика