Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2. Лекции по мат. статистике.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
531.97 Кб
Скачать

Решение.

  1. Найдем , где . (Ранее была формула .

  2. .

=1,25.

.

3) Вычислим теоретические частоты по замечанию 2. n = 100, h = 0,5, .

Составим таблицу:

i

xi

1

2,5

-1,9

0,0656

2,93

2

3

-1,45

0,1394

6,22

3

3,5

-1

0,242

10,8

4

4

-0,56

0,341

15,22

5

4,5

-0,11

0,3965

17,7

6

5

0,33

0,3778

16,86

7

5,5

0,78

0,2943

13,14

8

6

1,23

0,1872

8,36

9

6,5

1,67

0,0989

4,41

10

7

2,12

0,0422

1,88

4) По формуле (*) найдем величину набл. – наблюдаемое значение критерия Пирсона.

Составим таблицу:

i

ni

1

5

2,93

1,46

8,53

2

7

6,22

0,1

7,88

3

8

10,8

0,73

5,93

4

18

15,22

0,51

21,29

5

20

17,7

0,3

22,6

6

15

16,86

0,21

13,35

7

10

13,14

0,75

7,61

8

7

8,36

0,22

5,86

9

6

4,41

0,57

8,16

10

4

1,88

2,39

8,51

Σ

n = 100

97,52

7,24

109,72

.

Контроль: .

5) Найдем число степеней свободы: , где r – число групп выборки.

6) Найдем . Уровень значимости α = 0,01.

.

7) Сравним и : . Так как , то гипотезу о нормальном распределении генеральной совокупности принимаем. Эмпирические и теоретические частоты различаются незначимо.

Пп. 2. Критерий Стьюдента.

Для определения достоверности разницы средних для двух выборок применяют метод (критерий) Стьюдента или t - критерий. Этот критерий применяется к зависимым выборкам, например, результаты одной и той же группы испытуемых до и после воздействия независимой переменной.

Пусть случайная величина Х имеет нормированное нормальное распределение, то есть М(Х) = 0, σХ = 1.

Определение 53. Распределением Стьюдента с n-1 степенью свободы называется распределение случайной величины , где , , где Х подчинена нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Это распределение характеризуется плотностью , где Г(х) – известная гамма-функция . Число степеней свободы - число данных из выборки, значения которых могут быть случайными, то есть могут варьироваться. Для распределения Стьюдента составлены специальные таблицы.

По-другому, критерий Стьюдента - метод проверки однородности двух независимых выборок (то есть нет различий). В математико-статистических терминах постановка задачи такова: имеются две выборки x1, x2,..., xm и y1, y2,...,yn (т. е. наборы из m и n действительных чисел), требуется проверить их однородность.   Можно переформулировать задачу: требуется проверить, есть ли различие между выборками. Если различия нет, то для дальнейшего изучения часто выборки объединяют.

Опишем традиционный статистический метод проверки однородности. Вычисляют средние арифметические в каждой выборке: , , затем выборочные дисперсии: , , затем статистику t, на основе которой принимают решение:

.

По заданному уровню значимости и числу степеней свободы (m+n - 2) из таблиц распределения Стьюдента находят критическое значение tкр. Если |t| > tкр, то гипотезу однородности (отсутствия различия) отклоняют, если же |t| < tкр, то принимают. (При односторонних альтернативных гипотезах вместо условия |t| > tкр проверяют, что t > tкр; эту постановку рассматривать не будем, так как в ней нет принципиальных отличий от обсуждаемой нами.)

Замечание 1. Для обоснованного применения математико-статистических методов необходимо, прежде всего, построить и обосновать вероятностную модель порождения данных. При проверке однородности двух выборок общепринята модель, в которой x1, x2,..., xm рассматриваются как результаты m независимых наблюдений некоторой случайной величины Х с функцией распределения F(x), неизвестной статистику, а y1, y2,...,yn - как результаты n независимых наблюдений, вообще говоря, другой случайной величины Y с функцией распределения G(у), также неизвестной статистику. Предполагается также, что наблюдения в одной выборке не зависят от наблюдений в другой, поэтому выборки и называют независимыми. Возможность применения модели в конкретной реальной ситуации требует обоснования. Независимость и одинаковая распределенность результатов наблюдений, входящих в выборку, могут быть установлены или исходя из методики проведения конкретных наблюдений, или путем проверки статистических гипотез независимости и одинаковой распределенности с помощью соответствующих критериев. Если проведено (m+n) измерений линейных размеров деталей, то описанную выше модель, как правило, можно применять. Если же, например, xi и yi - результаты наблюдения одного и того же образца до и после определенного технологического воздействия, то рассматриваемую модель применять нельзя. (В этом случае используют модель так называемых связанных выборок, в которой обычно строят новую выборку zi = xi - yi и используют статистические методы анализа одной выборки, а не двух.) 

Замечание 2. Для определения достоверности разницы средних в случае зависимых выборок применяется следующая формула: , где d — разность между результатами в каждой паре; — сумма этих частных разностей; - сумма квадратов частных разностей. Полученные результаты сверяют с таблицей t, отыскивая в ней значения, соответствующие n-1 степени свободы; n — это в данном случае число пар данных. Перед тем как использовать формулу, необходимо вычислить для каждой группы частные разности между результатами во всех парах, квадрат каждой из этих разностей, сумму этих разностей и сумму их квадратов.