- •Введение
- •1Теоретическая часть
- •1.1Первичная обработка статистических данных
- •1.1.1Исходные данные
- •1.1.2Упорядочение данных наблюдения
- •1.1.3Способ равных интервалов
- •1.1.4Способ равных частот
- •1.1.5Группировка данных наблюдения над дискретной случайной величиной
- •1.2Порядковые статистики и ранги
- •1.2.1Статистическая процедура “Ранг и персентиль”
- •1.2.2Функция ранг
- •1.3Проверка параметрических гипотез
- •1.3.1Проверка гипотезы о значении математического ожидания нормальной случайной величины с известной дисперсией (одновыборочный z-критерий)
- •1.3.2Проверка гипотезы о значении математического ожидания нормальной случайной величины с неизвестной дисперсией (одновыборочный t-критерий)
- •1.3.3Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с известными дисперсиями (двухвыборочный z-критерий)
- •1.3.4Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с равными неизвестными дисперсиями (двухвыборочный t-критерий, равные дисперсии)
- •1.3.5Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с различными неизвестными дисперсиями (двухвыборочный t-критерий, различные дисперсии)
- •1.3.6Проверка гипотезы о разности математических ожиданий двух кореллированных нормальных случайных величин с неизвестными дисперсиями (двухвыборочный t-критерий, сопряженные пары наблюдений)
- •1.4Проверка гипотезы о законе распределения случайной величины (критерии согласия)
- •1.4.1Критерий согласия хи-квадрат Пирсона
- •1.4.2Критерий согласия Колмогорова
- •1.4.3Критерий Крамера-Мизеса-Смирнова
- •1.4.4Критерий Андерсона-Дарлинга
- •1.4.5Критерии w Шапиро-Уилка
- •2.1.6Эмпирическая функция распределения
- •2.1.7Эмпирическая плотность вероятности
- •2.1.8Эмпирический ряд распределения
- •2.1.9Статистическая процедура «Описательная статистика»
- •2.3.2Проверка гипотезы о значении математического ожидания нормальной случайной величины с неизвестной дисперсией (одновыборочный t-критерий)
- •2.3.3Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с известными дисперсиями (двухвыборочный z-критерий)
- •2.3.4Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с равными неизвестными дисперсиями (двухвыборочный t-критерий, равные дисперсии)
- •2.3.5Проверка гипотезы о разности математических ожиданий двух независимых нормальных случайных величин с различными неизвестными дисперсиями (двухвыборочный t-критерий, различные дисперсии)
- •2.3.6Проверка гипотезы о равенстве дисперсий двух независимых нормальных случайных величин (f-критерий)
- •2.3.7Проверка гипотезы о равенстве дисперсий нескольких независимых нормальных случайных величин (критерии Бартлета и Кокрена)
- •2.4Проверка гипотезы о законе распределения случайной величины (критерии согласия)
- •2.4.1Критерий согласия хи-квадрат Пирсона
- •2.4.2Критерий согласия Колмогорова
- •2.4.3Критерий Крамера-Мизеса-Смирнова
- •2.4.4Критерий Андерсона-Дарлинга
- •2.4.5Критерии w Шапиро-Уилка
- •Заключение
- •Список литературы
- •Приложение а
1.1.5Группировка данных наблюдения над дискретной случайной величиной
Содержание процесса группировки данных наблюдения над дискретной случайной величиной зависит от числа различных возможных значений этой случайной величины. Для группировки данных наблюдения над дискретной случайной величиной с малым числом возможных значений в Excel используют процедуру Гистограмма и встроенную статистическую функцию ЧАСТОТА. Различие заключается в том, что в поле Интервал карманов вводятся не границы интервалов группировки, а все целые числа от до включительно.
1.1.6Эмпирическая функция распределения
Эмпирическим аналогом функции распределения является эмпирическая функция распределения , которая при каждом принимает значение, равное относительной частоте случайного события .
Эмпирическая функция распределения при большом числе наблюдений определяется по формуле:
, (6)
где – накопленная частота -го интервала группировки.
1.1.7Эмпирическая плотность вероятности
Значение эмпирической плотности вероятности в -ом интервале группировки определяется с помощью формулы:
, , (7)
где – относительная частота (частость) попадания элементов выборки в -ый интервал группировки; – длина интервала.
1.1.8Эмпирический ряд распределения
Эмпирический ряд распределения представляет собой совокупность различных возможных значений случайной величины и частостей появления этих значений. Частость появления значения определяется по формуле:
, (8)
где – число элементов выборки объема , равных , .
1.1.9Статистическая процедура «Описательная статистика»
Для характеристики отдельных свойств распределения данных наблюдения в математической статистике широко используют специальные числовые параметры, найденные по результатам наблюдения и отражающие в сжатом виде основные, существенные черты распределения выборочных данных. Эти числовые параметры называют эмпирическими числовыми характеристиками. Выборочной характеристикой положения называется найденный по выборке числовой параметр, определяющий положение центра распределения наблюденных значений исследуемой случайной величины. Ниже приведены числовые характеристики.
Выборочное среднее вычисляют по формуле:
. (9)
Выборочную медиану вычисляют по формуле:
(10)
Выборочную моду вычисляют по формуле:
, (11)
где и – границы модального интервала; – значения эмпирической функции плотности в интервале, предшествующем модальному, модальному и следующим за модальным соответственно.
Выборочную дисперсию вычисляют по следующей формуле:
. (12)
Выборочное отклонение вычисляют по следующей формуле:
. (13)
Выборочный центральный момент вычисляют по формуле:
, (14)
где – порядок.
Выборочный коэффициент асимметрии вычисляют по формуле:
, (15)
Выборочный коэффициент эксцесса вычисляют по формуле:
. (16)
1.2Порядковые статистики и ранги
1.2.1Статистическая процедура “Ранг и персентиль”
Номер элемента упорядоченной выборки называется рангом этого элемента. Если бы все элементы выборки были различными, то каждый из них имел бы свой “персональный” ранг, равный номеру этого элемента в упорядоченной выборке. Однако при определении рангов приходится сталкиваться с проблемой совпадения наблюденных значений. Excel присваивает повторяющимся числам связки один и тот же ранг, равный номеру элемента связки в упорядоченной выборке.
Процентранги вычисляются по формуле:
, (17)
где – ранги элементов выборки.