Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Матстат / Kurs_Excel.doc
Скачиваний:
178
Добавлен:
10.02.2015
Размер:
1.48 Mб
Скачать

Задание 4. Критерий согласия хи-квадрат.

Постановка задачи.

Требуется проверить гипотезу о том, что функция распределения выборочных данныхпринадлежит нормальному семейству распределений(экспоненциальному, равномерному семейству).

Теоретические основы.

См. стр. 33-36 пособия [4].

Вычисления.

Пакет Excelпредоставляет возможность вычисления как значений функции надежности, так и значенийp-квантилей хи-квадрат распределения. Эти функции называютсяХИ2РАСПиХИ2ОБР.

Для вычисления нормального распределения можно использовать функцию НОРМРАСП. Подробнее см. ниже в главе “Встроенные функцииExcel”.

Интервалы группировки и частоты попадания в эти интервалы могут быть взяты из задания 2.

Ниже приведен фрагмент листа Excelс примером вычислений, проводимых при построении критерия хи-квадрат для проверки гипотезы нормальности.

Пример.

A

B

C

D

E

F

G

H

1

Границы

Выбор.

частоты

Вероятность

Ожидаем.

частоты

Хи-

квадрат

2

0

3

117,05

0

0,001

0,15

0,151

Критический уровень

4

118,05

1

0,013

1,19

0,031

значимости

5

119,05

3

0,071

5,86

1,395

9 ст.свободы

6

120,05

20

0,237

16,76

0,624

9 =

0,101

7

121,05

34

0,514

27,98

1,293

7 ст.свободы

8

122,05

23

0,784

27,27

0,669

7 =

0,041

9

123,05

13

0,938

15,51

0,407

10

124,05

3

0,989

5,15

0,896

0,05

11

125,05

4

0,999

0,99

9,076

12

>125,05

0

1

0,12

0,119

13

Всего

101

101,00

Вывод

14

Гипотеза нормальности не может быть принята или отвергнута

15

X2=

14,66

Порядок вычислений.

  1. Скопировать ячейки A2:B11 с листа “Гисто”, содержащие выборочные частоты, на рабочий лист в ячейкиA3:B12.

  2. В ячейке подсчитать B13общее число данных

  • =СУММ(B3:B12)

В столбце C (Вероятность) вычислить значение гипотетической функции распределения:

  1. в ячейку C3(напротив первой границы) ввести формулу

  • =НОРМРАСП(A3;Моменты!$B$4;Моменты!$B$6;1)

  1. – напомним, что в ячейках B4иB6на листе “Моменты” хранятся среднее и стандартное отклонение;

  • скопировать ячейку C3во все ячейки столбцаCвплоть до ячейки, соответствующей последней границе (C11);

  • в ячейке C2указать значение 0(соответствует), а в ячейкеC12– значение1(соответствует).

    В столбце D (Ожидаемые частоты) вычислить теоретические частоты:

    1. в ячейку D3ввести формулу

    • = $B$13*(C3-C2)

  • скопировать ячейку D3в столбцеDдо ячейкиD12(напротив границы “>125,05”);

  • для контроля в ячейке D13 (Всего)вычисляется сумма значений в столбцеD(должно получиться число101).

    В столбце E (Хи-квадрат)вычислить слагаемые статистики:

    1. в ячейку E3ввести формулу

    • = (B3-D3)^2/D3

    1. – в ячейке $B$13 хранится объем выборки;

  • скопировать ячейку E3в столбцеE до ячейкиE12;

  • в ячейке E15вычислить сумму значений столбцаE– искомое значение статистики.

    Вычислить уровни значимости r-3,r-1:

    1. в ячейки G6,G8 ввести формулы

    • =ХИ2РАСП(E15;10-1)

    • =ХИ2РАСП(E15;10-3)

    1. 10” – это число групп, для каждого студента оно может быть разным.

    Вывод в ячейке F11сделан в соответствии с правилом, описанным в пунктеVIIна стр. 36 пособия [4].

    Замечание 1.При проверке гипотезы экспоненциальности необходимо заменить ячейки, в которых вычисляются значения вероятностей попадания в интервалы (пункт 2) в соответствии с формулой экспоненциального распределения

    • =1-EXP(-A3/Моменты!$B$4)

    Критический уровень значимости вычисляется при и пристепенях свободы.

    Замечание 2.При проверке гипотезы равномерности необходимо, во-первых, выбрать равномерное разбиение отрезка [0;1]. Во-вторых, нужно заменить ячейки, в которых вычисляются значения вероятностей попадания в интервалы (пункт 2) в соответствии с формулой равномерного распределения (см. введение)

    • =A3

    Критический уровень значимости вычисляется при степени свободы.

    Контрольные вопросы.

    1. Сформулируйте статистическую задачу.

    2. Как строится критерий согласия хи-квадрат?

      1. 33.

    3. Почему критерий называется критерием согласия?

      1. 36.

    4. Выпишите формулу тестовой статистики критерия согласия хи-квадрат. Почему эту статистику можно считать мерой близости выборочных данных к выдвинутой гипотезе?

      1. 33.

    5. Какое распределение имеет статистика критерия хи-квадрат?

      1. 35.

    6. Почему иногда приходится вычислять два критических уровня значимости?

      1. 36.

    7. Чему равен критический уровень значимости при проверке гипотезы о равномерном (нормальном, экспоненциальном) распределении?

      1. 36.

    8. Почему при построении критерия хи-квадрат нельзя выбирать интервалы группировки в зависимости от выборочных данных?

      1. 36.

  • Соседние файлы в папке Матстат