- •Введение
- •1Теоретическая часть
- •1.1Первичная обработка статистических данных
- •1.1.1Исходные данные
- •1.1.2Упорядочение данных наблюдения
- •1.1.3Способ равных интервалов
- •1.1.4Способ равных частот
- •1.1.5Группировка данных наблюдения над дискретной случайной величиной
- •1.2Порядковые статистики и ранги
- •1.2.1Статистическая процедура “Ранг и персентиль”
- •1.2.2Функция ранг
- •1.3Проверка параметрических гипотез
- •1.3.1Проверка гипотезы о значении математического ожидания нормальной случайной величины с известной дисперсией (одновыборочный z-критерий)
- •1.3.2Проверка гипотезы о значении математического ожидания нормальной случайной величины с неизвестной дисперсией (одновыборочный t-критерий)
- •1.3.3Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с известными дисперсиями (двухвыборочный z-критерий)
- •1.3.4Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с равными неизвестными дисперсиями (двухвыборочный t-критерий, равные дисперсии)
- •1.3.5Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с различными неизвестными дисперсиями (двухвыборочный t-критерий, различные дисперсии)
- •1.3.6Проверка гипотезы о разности математических ожиданий двух кореллированных нормальных случайных величин с неизвестными дисперсиями (двухвыборочный t-критерий, сопряженные пары наблюдений)
- •1.4Проверка гипотезы о законе распределения случайной величины (критерии согласия)
- •1.4.1Критерий согласия хи-квадрат Пирсона
- •1.4.2Критерий согласия Колмогорова
- •1.4.3Критерий Крамера-Мизеса-Смирнова
- •1.4.4Критерий Андерсона-Дарлинга
- •1.4.5Критерии w Шапиро-Уилка
- •2.1.6Эмпирическая функция распределения
- •2.1.7Эмпирическая плотность вероятности
- •2.1.8Эмпирический ряд распределения
- •2.1.9Статистическая процедура «Описательная статистика»
- •2.3.2Проверка гипотезы о значении математического ожидания нормальной случайной величины с неизвестной дисперсией (одновыборочный t-критерий)
- •2.3.3Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с известными дисперсиями (двухвыборочный z-критерий)
- •2.3.4Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с равными неизвестными дисперсиями (двухвыборочный t-критерий, равные дисперсии)
- •2.3.5Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с различными неизвестными дисперсиями (двухвыборочный t-критерий, различные дисперсии)
- •2.3.6Проверка гипотезы о равенстве дисперсий двух независимых нормальных случайных величин (f-критерий)
- •2.3.7Проверка гипотезы о равенстве дисперсий нескольких независимых нормальных случайных величин (критерии Бартлета и Кокрена)
- •2.4Проверка гипотезы о законе распределения случайной величины (критерии согласия)
- •2.4.1Критерий согласия хи-квадрат Пирсона
- •2.4.2Критерий согласия Колмогорова
- •2.4.3Критерий Крамера-Мизеса-Смирнова
- •2.4.4Критерий Андерсона-Дарлинга
- •2.4.5Критерии w Шапиро-Уилка
- •Заключение
- •Список литературы
- •Приложение а
2.4.2Критерий согласия Колмогорова
Проверим гипотезу о том, что случайная величина будет иметь распределение Рэлея, если и – независимые гауссовские величины, имеющие одинаковую дисперсию и нулевое математическое ожидание. Сгенерируем последовательность из 10 таких чисел. Для этого воспользуемся функцией СЛЧИС.
Используя критерий Колмогорова при уровне значимости 0,02, проверим данную гипотезу.
Результат представлен на листе Excel «Крит. Колмогорова», а также на рисунке 2.23.
Рисунок 2.23. Критерий Колмогорова
Расчетное значение статистики меньше ее критического значения . На основании этого можно утверждать, что рассматриваемая гипотеза не противоречит данным наблюдения. Сравнивая расчетное значение модифицированной статистики с критическим, мы можем придти к такому же выводу.
2.4.3Критерий Крамера-Мизеса-Смирнова
С помощью процедуры Генерация случайных чисел, входящих в Пакет анализа, сформирована стандартная нормальная последовательность из 10 случайных чисел.
Используя критерий согласия Крамера-Мизеса-Смирнова при уровне значимости , проверим гипотезу H0 о том, что эти числа являются реализациями случайной величины , имеющей стандартное распределение (нормальное распределение с параметрами и .
Результат представлен на листе Excel «КМС», а также на рисунке 2.24.
Рисунок 2.24. Критерий Крамера-Мизеса-Смирнова
В ячейках C2:C11 находятся значения функции стандартного нормального распределения в точках , , вычисленные с помощью формулы массива =НОРМСТРАСП(В2:B11), введенные в диапазон C2:C11.
Поскольку расчетное значение статистики меньше ее критического значения, равного 0,4614, можно считать, что гипотеза о стандартном, нормальном распределении рассматриваемой последовательности случайных чисел не противоречит данным наблюдения. В пользу такого решения свидетельствует и значимость .
2.4.4Критерий Андерсона-Дарлинга
Проверим гипотезу 2.4.3 с помощью критерия Андерсона-Дарлинга.
Результат представлен на листе Excel «АД», а также на рисунке 2.25.
Рисунок 2.25. Критерий Андерсона-Дарлинга
Поскольку расчетное значение статистики меньше ее критического значения, равного 2,492, можно считать, что гипотеза о стандартном, нормальном распределении рассматриваемой последовательности случайных чисел не противоречит данным наблюдения. В пользу такого решения свидетельствует и значимость .
2.4.5Критерии w Шапиро-Уилка
А.
Используя данные о числе прибывших в РФ из СНГ, проверим гипотезу о том, что данные распределены по нормальному закону.
Результат представлен на листе Excel «WШУ А», а также на рисунке 2.26.
Рисунок 2.26. Проверка гипотезы о нормальном распределении
По таблице А.1 приложения А мы нашли критическое значение порядка статистики .
Значения коэффициентов , , , используемых при вычислении приближенного значения значимости , мы нашли по таблице А.2 приложения А.
Полученный результат (WH<WH(0,05)) свидетельствует о том, что гипотеза о нормальном распределении данных голосования противоречит фактическим данным наблюдения. Также сравнивая значимость α* с заданным уровнем значимости α=0,05, приходим к выводу о том, что проверяемая гипотеза противоречит данным наблюдения.
Б.
Пример 1.
Используя данные о числе прибывших в РФ из СНГ, проверим гипотезу о том, что данные распределены по показательному закону.
Результат представлен на листе Excel «WШУ Б 1», а также на рисунке 2.27.
Рисунок 2.27. Проверка гипотезы о показательном распределении
В ячейку G2 ввели формулу =9*ДИСП(А2:В6) /(10*СРЗНАЧ(A2:В6))^2. Верхняя и нижняя границы области принятия гипотезы, соответствующие уровню значимости были из таблицы А.3 приложения А.
Расчетное значение находится в области принятия гипотезы . Это означает, что гипотеза об экспоненциальном распределении не противоречит данным наблюдения и, следовательно, её надо принять.
Пример 2.
Используя данные о числе прибывших в РФ из СНГ, проверим гипотезу о том, что данные распределены по логарифмически нормальному закону.
Результат представлен на листе Excel «WШУ Б 2», а также на рисунке 2.28.
Рисунок 2.28. Проверка гипотезы о логарифмически-нормальном законе
Полученный результат ( ) свидетельствует о том, что гипотеза о логнормальном распределении противоречит фактическим данным наблюдения. К такому же выводу приводит и сравнение значимости с заданным уровнем значимости , , т.е. .
B.
Используя данные о температуре с 1 по 10 июня, проверим гипотезу о том, что исследуемая величина имеет смещенное экспоненциальное распределение с неизвестным смещением.
Результат представлен на листе Excel «WШУ В», а также на рисунке 2.29.
Рисунок 2.29. Проверка гипотезы о смещенном экспоненциальном распределении
Расчетное значение находится правее границ области принятия гипотезы . Это означает, что гипотеза о смещенном экспоненциальном распределении противоречит данным наблюдения и, следовательно, её надо отклонить.