
- •С.Е.Игнатова математическая статистика
- •Санкт-Петербург
- •Утверждено редакционно-издательским советом сПбГиэу
- •Игнатова с.Е.
- •Содержание:
- •Предисловие
- •Введение
- •1.Генеральная совокупность, выборка и основные способы организации выборки.
- •2.Вариационный ряд и порядковые статистики.
- •3.Статистическое оценивание параметров.
- •4.Точечные оценки и их свойства (несмещенность, состоятельность и эффективность).
- •5.Основные выборочные характеристики и их свойства.
- •5.1.Генеральная и выборочная средние.
- •5.2.Групповая и общая средние.
- •5.3.Отклонение от общей средней и его свойство.
- •5.4.Генеральная и выборочная дисперсии.
- •5.5.Групповая, внутригрупповая, межгрупповая и общая дисперсии.
- •5.6.Сложение дисперсий.
- •6.Основные точечные оценки.
- •6.1.Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних.
- •6.2.Оценка генеральной дисперсии по исправленной выборочной.
- •7.Законы распределения выборочных характеристик в нормальной генеральной совокупности.
- •7.1.Число степеней свободы.
- •7.2.Распределение хи-квадрат.
- •7.3.Распределение Стьюдента.
- •7.4.Распределение Фишера-Снедекора.
- •8.Интервальные оценки и доверительные области.
- •8.1.Оценка вероятности (биноминального распределения) по относительной частоте.
- •8.2.Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении.
- •8.3.Доверительный интервал для оценки среднего квадратического отклонения нормального распределения.
- •9.Байесовское статистическое оценивание.
- •10.Статистическая проверка гипотез: основные типы гипотез и общая логическая схема статистического критерия; характеристики качества критерия.
- •10.1.Общая логическая схема статистического критерия
- •10.2.Характеристики качества критерия.
- •11.Критерии согласия и однородности, проверка гипотезы о числовых значениях параметров.
- •11.1.Критерий однородности.
- •Например, рассмотрим непараметрический критерий сдвига.
- •11.2.Критерий согласия.
- •11.3.Методика вычисления теоретических частот нормального распределения:
- •11.4.Пример обработки массива статистических данных.
- •11.5.Сравнение двух дисперсий нормальных генеральных совокупностей
- •12.Неравенство информации, метод максимального правдоподобия и метод моментов.
- •12.1.Метод максимального правдоподобия
- •12.2.Неравенство информации
- •12.3.Эмпирические моменты
- •12.4.Метод моментов.
- •13.Основы статистического исследования зависимостей.
- •13.1.Регрессионный анализ.
- •13.1.1.Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным.
- •13.1.2.Выборочный коэффициент корреляции.
- •13.1.3.Корреляционная таблица.
- •13.1.4.Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным.
- •13.1.5.Выборочное корреляционное отношение.
- •13.1.6.Свойства выборочного корреляционного отношения.
- •13.1.7.Простейшие случаи криволинейной корреляции.
- •13.1.8.Понятие о множественной корреляции.
- •13.2.Дисперсионный анализ.
- •13.2.1.Общая, факторная и остаточная суммы квадратов отклонений
- •13.2.2.Связь между общей, факторной и остаточной суммами.
- •13.2.3.Общая, факторная и остаточная дисперсии.
- •13.2.4.Сравнение нескольких средних методом дисперсионного анализа.
- •13.2.5.Неодинаковое число испытаний на различных уровнях фактора.
- •Заключение
- •Список литературы:
- •Сведения об авторе
Например, рассмотрим непараметрический критерий сдвига.
Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу. Пусть заданы две выборки:
,
,
взятые из неизвестных непрерывных распределений F(x) и G(y) соответственно.
Нулевая гипотеза
.
Наиболее
частая альтернативная
гипотеза
.
Если же принимаются какие-либо дополнительные предположения о законе распределения вероятностей, то можно применять параметрические критерии однородности.
К параметрическим критериям однородности относится cравнение параметров нормальных распределений.
Пример:
Пусть имеются две выборки независимых
случайных величин
.
Необходимо, на основе выборочных данных,
установить наличие значимой разницы в
средних двух совокупностей, из которых
извлечены выборки.
Нулевая гипотеза:
.
Альтернативы:
,
,
.
Сравнение при известных дисперсиях осуществляется при помощи критерия Стьюдента.
Сравнение при неизвестных равных дисперсиях осуществляется при помощи критерия Стьюдента.
Сравнение при неизвестных неравных дисперсиях осуществляется при помощи модификаций критерия Стьюдента: критерия Кохрена-Кокса, Критерия Сатервайта, критерия Уэлча.
Сравнение двух выборочных средних в связанных выборках осуществляется при помощи критерия Стьюдента.
Критерий Уолша позволяет проверять гипотезу о принадлежности одного наблюдения нормальному распределению, генерирующему выборку.
Существует также двухступентчатый двухвыборочный медианный критерий Волфа.
Критерий Фишера для сравнения двух средних с одинаковыми дисперсиями эквивалентен критерию Стьюдента и основан на связи между распределениями Стьюдента и Фишера.
Историческая справка: Критерий Стьюдента был разработан Уильямом Госсеттом для оценки качества пива на пивоваренных заводах Гиннесса в Дублине (Ирландия). В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
11.2.Критерий согласия.
Если закон распределения неизвестен, то проверяют нулевую гипотезу: генеральная совокупность распределения по закону А. Проверка производится с помощью специально подобранной величины – критерия согласия.
Определение: Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Имеется несколько
критериев согласия:
( «хи-квадрат») Пирсона, Колмогорова,
Смирнова и др.
Проверим гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона.
Будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты. Обычно они различаются.
Критерий не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.
Пусть по выборке объема n получено статистическое (эмпирическое) распределение:
|
…
|
|
…
|
Пусть также
вычислены теоретические частоты
в предположении нормального распределения.
При уровне значимости α требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально. В качестве критерия проверки нулевой гипотезы примем случайную величину:
(1)
Чем меньше различие частот и , тем меньше величина .
Правило:
Для того, чтобы при заданном уровне
значимости проверить гипотезу
«генеральная совокупность распределена
нормально», надо сначала вычислить
теоретические частоты, а затем наблюдаемое
значение критерия
(2)
По таблице критических точек распределения по заданному уровню значимости α и числу степеней свободы k=s - 3 (где s – число частичных интервалов) найти критическую точку:
(α;k).
Если
<
,
то нет оснований отвергнуть нулевую
гипотезу.
Если > , то нулевую гипотезу отвергают.
Объем выборки должен быть достаточно велик – не менее 50. Каждая группа (интервал) должна содержать не менее 5-8 вариант. Малочисленные группы следует объединять в одну, суммируя частоты.
Для контроля вычислений формулу (2) преобразуют к виду
Пример: При уровне значимости 0,1 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирическая и теоретическая частоты:
Эмпирические частоты: 6 13 38 74 106 85 30 14
Теоретические частоты: 3 14 42 82 99 76 37 13
Решение: Вычислим , для чего следует составить расчетную таблицу. Получим =7,19. Контроль вычислений:
Вычисления произведены правильно. Найдем число степеней свободы, учитывая, что число групп выборки (число частичных интервалов) S = 8; k = 8 - 3 = 5.
По таблице критических точек распределения по уровню значимости α=0,1 и числу степеней свободы k = 5 находим:
(0,1;5) = 9,24.
Т.к. < – нет оснований отвергнуть нулевую гипотезу.
Другими словами, расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.
Большая часть работы заключается в вычислении теоретических частот нормального распределения. Методику вычисления этих частот можно изложить в виде следующего алгоритма.