Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Работа с пакетом Statistica для pdf.doc
Скачиваний:
31
Добавлен:
12.03.2015
Размер:
1.11 Mб
Скачать

Проверка гипотезы о нормальности распределения выборки

О нормальности распределения можно судить по графику на нормальном вероятностном графике. Чем ближе распределение к нормальному виду, тем лучше значения ложатся на прямую линию. Этот метод оценки является фактически глазомерным. В сомнительных случаях проверку на нормальность можно продолжить с использованием специальных статистических критериев (Колмогорова-Смирнова, Лилиефорса).

Для этого можно рассмотреть распределение переменной на гистограмме с выводом на гистограмму следует плотности нормального распределения, проверить близость распределения к нормальному виду при помощи критериев Колмогорова-Смирнова, Лилиефорса и др.

Получить график для переменной var1.

  1. Открыть файл diams.sta, вызвать команду Analysys/Descriptive statistics, в окне команды щелкнуть по кнопке Normal probability plots. Окно с полученным графиком скопировать в созданный Вами документ Microsoft Word. Сохранить документ.

Рассмотреть распределение переменной VAR1 на гистограмме.

Указать на гистограмме плотности нормального распределения.

Проверить близость распределения к нормальному виду при помощи критериев

а) Колмогорова-Смирнова,

б) Лилиефорса.

  1. Активизировать окно команды Descriptive statistics, щелкнув по кнопке Continue… в окне графика, либо вызвать команду, как было описано ранее.

  2. В группе опций Distribution необходимо установить флажок напротив соответствующих статистик Normal expected frequencies, K-S and Liliefors test for normality.

  1. Щелкнуть по кнопке Histograms в области Distribution. На гистограмме показана кривая плотности нормального распределения, а также критерий Колмогорова-Смирнова (K-S d).

Чем меньше величина этой статистики, тем ближе распределение случайной величины к нормальному.

Вероятность нулевой гипотезы (выборка подчиняется нормальному распределению) показана значением величины р.

  1. Сформировать в созданном Вами документе Microsoft Word таблицу по образцу

    Имя переменной

    Значение критерия Колмогорова-Смирнова

    Вероятность нулевой гипотезы

    VAR1

  2. Занести в таблицу полученные данные, для вероятности нулевой гипотезы указать, больше или меньше она приведенной величины.

Получение таблиц частот

Получить распределение данных переменной VAR1 из файла diams.sta в виде таблицы частот с группировкой данных для 12 интервалов.

  1. Число интервалов указывается в окне команды Analysys/Descriptive statistics в области Categorization опцией Number of intervals.

Отметить опцию Number of intervals и установить количество интервалов 12 в окне рядом с опцией.

Щелкнуть по кнопке Frequency tables.

В качестве переменной указать переменную VAR1.

  1. В созданную Вами таблицу в документе Microsoft Word добавить еще столбцы по образцу

    Границы интервала с наибольшим попаданием величин

    Левая

    Правая

  2. Занести в таблицу значения левой и правой границ интервала, в который попало наибольшее количество значений переменной VAR1.

  3. Укажите ниже таблицы, каково число попаданий в указанный Вами интервал. Эта величина выдается в поле Count таблицы.

  1. Получить распределение данных в виде таблицы частот с организацией групп с целочисленными границами. В окне команды Analysys/Descriptive statistics в области Categorization отметить опцию Integer intervals (categories).

  2. Щелкнуть по кнопке Frequency tables.

Сгруппировать данные выборки по 6 интервалам с точными границами

  1. В окне команды Analysys/Frequency tables задать число интервалов со строгими границами, введя в поле No. of exact intervals число 6.

  2. В созданный Вами документ Microsoft Word добавить таблицу по образцу:

    Переменная VAR1

    Интервалы

    Границы

    Число попаданий

    Левая

    Правая

    6 интервалов с точными границами

    Шаг задания интервала 0,15

  3. Занести в таблицу документа Microsoft Word значения левой и правой границ интервала, в котором произошло наибольшее попадание значений переменной, и число попаданий.

Получить таблицы частотных распределений для переменной VAR1 из файла diams.sta. Сгруппировать данные выборки, задав для диапазона шаг 0.15 и начало диапазона 13 и вычислить для них частоты попадания в полученные интервалы. Число интервалов 6.

  1. Вызвать команду Analysys/Frequency tables.

В окне команды указать размер шага для интервалов, задав в поле Step size значение 0.15.

Начало интервалов указать в поле starting at, введя число 13.

Поле доступно после отключения опции at minimum.

Число интервалов оставить равным 6.

Щелкнуть по кнопке Frequency tables.

  1. Занести в таблицу значения левой и правой границ интервала, в котором произошло наибольшее попадание значений переменной при шаге задания интервала 0,15, и число попаданий.