Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
4
Добавлен:
19.01.2025
Размер:
2.21 Mб
Скачать

 

 

6

2

 

 

(3)

 

1

 

3

 

 

Э

24

2

 

3

5

(3)

1

 

3

 

Где , Э – ошибки коэффициентов асимметрии и эксцесса, которые зависят только от объема выборки. Рассчитаем ошибки коэффициентов асимметрии и эксцесса по формулам (3):

 

 

6 10

2

0,58;

Э

24 10

10

2

10

3

0,75

10 1

10 3

10

1

 

10

3

10

5

 

Проверим условия:

0,87,

т. е

| |

1,5 ;

 

 

 

 

 

 

 

|0,86|

 

 

 

 

 

 

 

 

 

 

 

6

 

 

Э

 

 

 

 

Оба

неравенства выполняются, следовательно, нет оснований отвергнуть

 

 

|1,10|

1,125,

т. е

Э

17

 

1,5 .

 

 

 

гипотезу о нормальном распределении случайной величины X.

1.2 Проверка гипотезы о наличии равенстве средних и о равенстве дисперсий

Задача для решения в классе (пример 1.2)

Дана статистика Росстата ежегодных отчислений в ПФР с 2000 по 2016 гг. за счет налогов (Y1) и за счет средств федерального бюджета (Y2) на одного человека трудоспособного возраста, в ценах 2000 года, тыс. рублей. Исходные данные представлены в таблице Б.1 и рисунке Б.1 приложения Б и на. Необходимо проверить гипотезу о равенстве дисперсий и о равенстве средних в ряду данных с 2000 по 2010 годы.

Решение

11

Рассмотрим период времени с 2000 по 2010 год. Осуществим подготовку данных: разобьем ряд на две подвыборки. Результаты расчетов сведем в таблицу

5.

Таблица 5 – Вспомогательные расчеты к примеру 1.2

Характеристики ряда

 

 

Подвыборка 1:

 

 

Подвыборка 2:

 

 

 

 

 

 

 

 

 

2000 – 2004

 

 

2005 – 2010

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число наблюдений

 

 

 

 

5

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

Оценка дисперсии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее значение

 

 

 

 

0,47

 

 

 

 

 

1,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5,2

 

 

 

 

5,0

 

 

 

 

 

 

 

 

 

1.1. Проверка гипотезы о равенства дисперсий.

 

 

 

 

 

 

 

 

 

 

Проверим однородность дисперсий в первой и второй подвыборках с

помощью критерия Фишера. Сформулируем гипотезы.

 

 

 

 

 

 

.

 

 

H0: генеральная дисперсия ряда в подвыборках 1 и 2 одинакова,

 

,

 

H1: генеральная дисперсия ряда в подвыборках различается,

 

 

 

 

Расчетное значение критерия Фишера определяется по

формуле (4).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

РАСЧ

 

 

при

 

 

 

 

 

 

 

 

 

 

 

(4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку выборочная дисперсия второй подвыборки больше, чем

дисперсия первой (

 

 

),

. в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперсии второй подвыборки

числителе

критерия

будет стоять

оценка

 

 

 

 

 

РАСЧ

1,25

 

 

2,66

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,47

 

 

 

 

 

 

 

 

 

 

 

 

 

Критическое значение критерия определяем по таблице распределения

 

 

 

 

 

 

 

 

 

 

 

 

;

 

 

 

1;

 

 

 

1

 

Фишера (см. таблицу А.2 приложения А):

 

КРИТ

 

 

принимается гипотеза H0:

 

 

0,05; 5; 4

6,26

. Поскольку

 

 

 

 

 

КРИТ

 

 

 

 

 

 

 

РАСЧ

 

 

КРИТ

 

 

 

 

 

 

 

 

 

генеральная дисперсия ряда в подвыборках 1 и 2 одинакова (дисперсии однородны).

12

1.2. Проверка гипотезы о равенстве средних.

Поскольку в предшествующей проверке подтвердилась основная гипотеза о равенстве дисперсий, сформулируем гипотезу о равенстве средних при равных дисперсиях.

H0: генеральное среднее ряда в подвыборках 1 и 2 постоянно при

постоянной дисперсии,

 

 

,

 

 

 

.

 

 

 

 

 

 

 

H : генеральное

 

 

 

 

 

 

 

 

 

 

1

 

 

среднее ряда в подвыборках 1 и 2 не одинаково при

постоянной дисперсии,

 

 

,

 

 

 

.

 

 

 

 

 

 

 

Расчетное

 

 

 

 

 

 

 

 

 

 

 

 

 

значение критерия определяем по формуле (5).

 

 

РАСЧ

|

 

|

 

 

;

 

 

 

1

 

1

(5)

1/

1/

 

 

 

 

 

2

 

 

Рассчитаем

 

0,47 4 1,25 5 /9

0,950

РАСЧ

|5,2

5,0|

0,35

0,950

1/5 1/6

КритическоезначениеопределяемпотаблицамраспределенияСтъюдента:

КРИТ ; 2 КРИТ 0,05; 9 2,26. Поскольку. | РАСЧ| КРИТ,

основная гипотеза о равенстве средних не отклоняется: средние двух периодов времени равны.

1.3 Реализация проверки гипотезы о равенстве дисперсий и о равенстве средних в Excel

Продемонстрируемработуиполучимотчетыкрешениюзадачи1.2 вExcel. Для реализации проверки гипотезы о равенстве дисперсий необходимо выбратьпунктменю«Анализданных»/»ДвухвыборочныйF-тестдлядисперсий»

(таблица 6)

В появившемся окне необходимо выбрать диапазоны ячеек, соответствующие подвыборкам 1 и 2. Здесь следует отметить, что для того,

13

чтобы отчет Excel полностью соответствовал ручному расчету, необходимо в первом диапазоне указывать подвыборку с большим значением дисперсии. Помимо этого, в Excel формулируется следующая альтернативная гипотеза:. Поэтому в отчете представлены значения односторонней критической области.

Таблица 6 – Двухвыборочный F-тест для дисперсии, Excel

 

Диапазон 1

Диапазон 2

 

(Подвыборка 2)

(Подвыборка 1)

Среднее

5,03

5,22

Дисперсия

1,2547

0,4670

Наблюдения

6

5

df

5

4

F

2,6867

 

P(F<=f) одностороннее

0,1798

 

F критическое одностороннее

6,2561

 

Сформулируем вывод: так как F критическое одностороннее > F, принимается основная гипотеза о равенстве дисперсий (об этом свидетельствует такжеP(F<=f) одностороннее, котороепринялозначениеболеезаданногоуровня значимости 0,05). Для реализации гипотезы о равенстве средних необходимо в зависимости от выводов, полученных на этапе 1, выбрать один из пунктов меню:

«Анализ данных»/ «Двухвыборочный t-тест с одинаковыми дисперсиями»;

«Анализ данных»/ «Двухвыборочный t-тест с различными дисперсиями».

Впоявившемся окне необходимо выбрать диапазоны ячеек, соответствующие подвыборкам 1 и 2 (таблица 7). Сформулируем вывод: поскольку при формулировании альтернативной гипотезы формируется двусторонняя критическая область, будем опираться на строки отчета P(T<=t) двухстороннее, t критическое двухстороннее. Так как расчетное значение t- статистики меньше t критическое двухстороннее, принимается основная гипотеза, средние двух подвыборок равны. Об этом свидетельствует также значение P(T<=t) двухстороннее, которое приняло значение заданного уровня значимости 0,05.

14

Таблица 7 – Двухвыборочный t-тест с одинаковыми дисперсиями, Excel

 

Диапазон 1

Диапазон 2

 

(Подвыборка 2)

(Подвыборка 1)

Среднее

5,03

5,22

Дисперсия

1,2547

0,4670

Наблюдения

6

5

Объединенная дисперсия

0,904592593

 

Гипотетическая разность

 

 

средних

0

 

df

9

 

t-статистика

0,32411904

 

P(T<=t) одностороннее

0,376626828

 

t критическое

 

 

одностороннее

1,833112933

 

P(T<=t) двухстороннее

0,753253657

 

t критическое

 

 

двухстороннее

2,262157163

 

Для удобства анализа результатов ручного расчета и отчета Excel сведем все результаты в единую таблицу 8.

Таблица 8 - Сравнительный анализ результатов ручного расчета и отчета Excel

Показатель

Ручной расчет

Excel

Среднее (подвыборка 1)

5,2

 

5,22

Дисперсия (подвыборка 1)

1,25

 

1,2547

Среднее (подвыборка 2)

5

 

5,03

Дисперсия (подвыборка 2)

0,47

 

0,4670

 

2,66

 

2,6867

Критическое значение

 

 

F критическое

РАСЧ

КРИТ 0,05; 5; 4

6,26

 

одностороннее = 6,2561

Вывод

Дисперсии равны

P(F<=f)

 

 

 

одностороннее=0,1728

 

 

 

Дисперсии равны

 

0,35

 

0,3241

Критическое значение

КРИТ 0,05; 9

2,26

t критическое

РАСЧ

двухстороннее=

 

 

 

2,262157163

 

 

 

Вывод

Средние равны

P(T<=t) двухстороннее=

 

 

 

0,753253657

 

 

 

Средние равны

 

 

 

 

15

1.4 Задачи для самостоятельной отработки знаний навыков и умений

Задача1. Самостоятельное решение задач по теме 1.

Проверьтегипотезуоравенстведисперсийиоравенствесреднихдлярядов уровней безработицы в Германии и Италии (таблица 9).

Таблица 9 – Исходные данные к задаче 1. Самостоятельное решение.

Год

Уровень безработицы

Уровень

 

Германии, %

безработицы

 

 

Италии, %

1990

6,155

8,858

1991

5,47

8,533

1992

6,592

8,808

1993

7,775

9,833

1994

8,425

10,633

1995

8,233

11,15

1996

8,908

11,15

1997

9,658

11,242

1998

9,383

11,333

1999

8,558

10,942

2000

7,95

10,1

2001

7,8

9,1

2002

8,6

8,608

2003

9,708

8,45

2004

10,333

7,975

2005

11,008

7,692

2006

10,042

6,8

2007

8,567

6,133

2008

7,383

6,733

2009

7,667

7,742

2010

6,933

8,342

2011

5,858

8,4

2012

5,367

10,683

2013

5,242

12,142

2014

5,008

12,608

2015

4,633

11,908

2016

4,158

11,65

2017

3,758

11,275

2018

3,417

10,625

2019

3,133

9,9

16

Задача 2. Самостоятельное решение задач по теме 1.

Продавец утверждает, что средний вес пачки макарон составляет 100 г. Из партии извлечена выборка в 10 пачек (таблица 10). Должны ли мы принять гипотезу продавца? Доверительную вероятность считаем равной 99%.

Таблица 10 – Данные к задаче 2. Самостоятельное решение по теме 1.

Номер пачки

1

2

3

4

5

6

7

8

9

10

Вес пачки

99

97

104

98

98

96

100

101

97

99

Задача 3. Самостоятельное решение задач по теме 1.

Вытачиваемая на станке ось по ГОСТу должна иметь диаметр 100 мм. В выборке с n = 20 средний диаметр оказался равным 101 мм, а выборочная дисперсия составила 2. Соответствует ли станок ГОСТу? Доверительную вероятность считаем равной 99%.

Задача 4. Самостоятельное решение задач по теме 1.

На заводе сравнили производительность двух линий по выпуску удобрений (таблица 11). Можно ли считать, что производительность линий одинакова? Доверительную вероятность считаем равной 95%.

Таблица 11 – Данные к задаче 4. Самостоятельное решение по теме 1.

Час работы

1

2

3

4

5

6

Производство первой линии, кг

14,2

13,2

14,6

13,7

14,0

13,9

Производство второй линии, кг

14,1

14,5

13,6

12,5

14,1

13,7

Задача 5. Самостоятельное решение задач по теме 1.

До наладки станка дисперсия диаметра выпускаемых им шариков составляла 8,7. После наладки она составила 5,8. В обоих случаях n = 15 (размер выборки). Можнолисчитать, чтоналадкастанкапрошлауспешноиеготочность увеличилась? Доверительную вероятность считаем равной 95%. Подсказка:

дисперсия биномиального распределения равна 1 .

Задача 6. Самостоятельное решение задач по теме 1.

На экзамене по прикладной математике из 200 задач первого раздела

студенты правильно решили 132 задачи, а из 300 задач второго раздела – 168. 17

Можно ли утверждать, что первый раздел курса студенты лучше усвоили, чем второй? Доверительнуювероятностьсчитаемравной99%. Подсказка: дисперсия

биномиального распределения равна

1

.

Задача 7. Самостоятельное решение задач по теме 1.

Выборочная проверка надежности ноутбуков двух производителей дала следующие результаты: в течение месяца после продажи в 15 случаях из 200 для ноутбуков марки А и в 25 случаях из 300 для ноутбуков марки В покупатели обратились к продавцу с жалобами на неполадки. Различается ли надежность ноутбуков двух производителей? Доверительную вероятность считаем равной

99%.

1.5 Решение тестовых заданий по теме 1.

Тестовое задание 1 по теме 1.

На графике закона распределения показателя X (функция f(X) на рисунке 2 по сравнению с нормальным законом наблюдается…

Рис. 2. Функция плотности распределения случайной величины

Варианты ответов:

А. правосторонняя асимметрия Б. левосторонняя асимметрия В. положительный эксцесс Г. отрицательный эксцесс

Решение

На графике наблюдается асимметрия. Асимметрия– это смещениесреднего значения левее или правее относительно моды. В пунктирном графике функции

18

плотности распределения случайной величины мода смещена влево относительно графика нормального закона распределения. Среднее значение расположено правее моды – наблюдается правосторонняя асимметрия.

Ответ: А.

Тестовое задание 2 по теме 1.

Имеется информация по двум выборкам:

Выборка 1:

30

18

 

среднее значение

 

 

среднеквадратическое отклонение – 2

Выборка 2:

 

 

 

среднее значение

отклонение – 6

 

 

 

среднеквадратическое30

12

Какую из гипотез следует выдвинуть при проверке равенства средних ?

А.

 

 

приравных дисперсиях

Б.

В.

 

 

при неравных дисперсиях

Г.

 

 

при неизвестных дисперсиях

Д.

 

 

при равных среднеквадратических отклонениях

Е.

 

 

при среднеквадратических отклонениях

 

 

 

принеизвестных среднеквадратических отклонениях

Решение

Проверка гипотезы о равенстве средних осуществляется в 2 этапа. Этап 1. Проверка равенства дисперсий. Этап 2. Проверка равенства средних в зависимости от результата, который получился (то есть при равных или неравных дисперсиях). Так как значения дисперсий по выборкам известны, то вариант «с неизвестными значениями дисперсий» не подходит. Рассчитаем значение F-критерия Фишера по формуле (4):

6

РАСЧ 2 9

 

 

ТАБЛ 0,05; 29; 29

1,86

Расчетное значение

РАСЧ

ТАБЛ

дисперсии не равны. Следовательно,

необходимо проверить

 

 

 

Ответ: Б.

гипотезу о равенстве средних при неравных дисперсиях.

 

 

 

 

 

 

Тестовое задание 3 по теме 1.

 

 

Имеется информация по двум выборкам:

 

Выборка 1:

 

 

10

18

 

 

среднее значение

 

 

 

 

 

 

 

 

 

 

19

 

 

 

 

2

10

12

 

 

 

Выборка 2:

 

 

 

среднее значение

 

Также

2

 

 

 

 

доказано статистически, что дисперсии двух выборок равны.

Определите расчетное значение критерия Стъюдента для проверки

гипотезы о равенстве средних ?

 

 

А. 1

 

 

 

 

 

Б. 6

 

 

 

 

 

В. 0

 

 

 

 

 

Г. 9,5

 

 

 

 

 

Д. 10

 

 

 

 

 

Решение

 

2 9

2 9 /18

1,4

 

 

 

 

РАСЧ

|18 12|

9,5

 

 

1,4

1/10 1/10

Ответ. Г

1.6 Решение варианта контрольной работы №1 по теме 1

Задача 1. Контрольная работа 1. На основании значений показателя X из таблицы 12 нарисуйте гистограмму частот.

Таблица 12 – Исходные данные и вспомогательные расчеты задачи 1 контрольной работы 1.

Дата

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-60,72

 

 

 

 

 

 

 

 

 

 

 

Январь

10

 

-7,9

 

 

62

 

-0,98

 

 

478,15

Февраль

10

 

-7,9

 

 

62

 

-0,98

 

-60,72

 

478,15

Март

20

 

2,1

 

 

5

 

0,26

 

1,19

 

2,54

Апрель

15

 

-2,9

 

 

8

 

-0,36

 

-2,95

 

8,49

Май

30

 

12,1

 

 

147

 

1,51

 

221,62

 

2687,12

Июнь

20

 

2,1

 

 

5

 

0,26

 

1,19

 

2,54

Июль

10

 

-7,9

 

 

62

 

-0,98

 

-60,72

 

478,15

Август

28

 

10,1

 

 

103

 

1,26

 

129,05

 

1306,59

20