
- •3. Вычисление основных статистических характеристик и изучение формы распределения в системе statistica
- •3.1. Вычисление основных статистических характеристик
- •3.2. Изучение формы распределения
- •3.2.1. Аналитическое изучение формы распределения
- •3.2.2. Графическое изучение формы распределения
- •3.2.3. Изучение формы распределения с помощью критериев согласия
- •3.3. Проверка гипотез о равенстве средних для нормальных распределений
- •3.3.1. T-критерий для зависимых выборок
- •3.3.2. T-критерий для независимых выборок
3.2.3. Изучение формы распределения с помощью критериев согласия
Критерии согласия, используемые в системе Statistica, доступны в диалоговом окне Frequency tables – Таблицы частот меню Analysis – Анализ модуля Basic Statistics and Tables – Основные статистики и таблицы.
В этом диалоговом окне имеется группа кнопок Tests of normality – Критерии нормальности:
K-S test - Критерий Колмогорова-Смирнова вычисляется при известном среднем и среднеквадратическом отклонении генеральной совокупности. Если вычисленная D-статистика значима (на экране строка будет иметь красный цвет), то гипотеза о том, что данные имеют нормальное распределение, отвергается. В противном случае, гипотеза о нормальности распределения принимается.
Lilliefors test - Критерий Лиллиефорса вычисляется при неизвестном среднем и среднеквадратическом отклонении генеральной совокупности (они оцениваются по имеющимся данным). Как и в предыдущем случае, если вычисленная D-статистика значима и строка на экране красного цвета, то гипотеза о том, что данные имеют нормальное распределение, отвергается. В противном случае, гипотеза о нормальности распределения принимается.
Shapiro – Wilk’s W test – Критерий Шапиро-Уилка W - по данным наблюдений вычисляется W-статистика, и если она значима (на экране строка выделена красным цветом), гипотеза о нормальном характере распределения отвергается, в противном случае – принимается.
Отметив галочками все три критерия в группе опций Tests of normality – Критерии нормальности окна Frequency tables – Таблицы частот (рис. 10),
Рис. 9 Диалоговое окно Frequency tables – Таблицы частот
нажмем клавишу Tests for normality. Результат представлен на рис 11.
Рис. 10 Окно результатов Tests of normality – Критерии нормальности
Строки, соответствующие переменной GABARIT, во всех трех таблицах выделены красным цветом, что говорит о необходимости отвергнуть гипотезу о нормальном характере распределения данной переменной. Гипотеза о нормальном характере распределения переменной VES принимается.
Расчет всех рассмотренных критериев возможен также в окне Descriptive statistics – Описательная статистика (см. рис. 2). Соответствующие опции имеются в группе опций Distribution – Распределение, и если отметить их галочками, то рассчитанные значения будут отображены либо под названием гистограммы (при построении гистограмм), либо над таблицей частот (при построении таблицы частот).
3.3. Проверка гипотез о равенстве средних для нормальных распределений
Проверка гипотезы о равенстве средних двух совокупностей имеет важное практическое значение. Так, иногда оказывается, что среднее значение одной выборки отличается от среднего значения другой, хотя обе выборки взяты из схожих совокупностей.. Возникает вопрос: можно ли это различие объяснить случайной ошибкой экспериментов или же оно не случайно?
Сравнивать средние в двух группах позволяет сравнивать t-критерий. В меню Analysis – Анализ модуля Basic Statistics and Tables – Основные статистики и таблицы предлагаются t-test for independent samples – t-критерий для независимых выборок и t-test for dependent samples – t-критерий для зависимых выборок. Если мы имеем дело с развитием явления, например, если выборки извлечены из одной и той же совокупности в разные моменты времени, то следует использовать t-test for dependent samples – t-критерий для зависимых выборок. Если же между выборками нет причинной связи, следует использовать t-test for independent samples – t-критерий для независимых выборок.