Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистическая обработка экспериментальных данных (110

..pdf
Скачиваний:
18
Добавлен:
15.11.2022
Размер:
1.1 Mб
Скачать

Каждый из методов

реализован

в виде отдельного режима работы. Для его

активизации необходимо

выделить

соответствующий метод указателем мыши и

щелкнуть по кнопке Ок. Диалоговое окно каждого режима включает в себя универсальные и специфические параметры. К универсальным параметрам относятся: Поле Входной интервал – вводится ссылка на ячейки, содержащие анализируемые данные Переключатель Группирование – устанавливается в положение По столбцам или По строкам в зависимости от расположения данных в диапазоне Флажок Метки – устанавливается в активное состояние, если первая строка (столбец) во входном диапазоне содержит заголовки.

Переключатель Выходной интервал/Новый рабочий лист/Новая рабочая книга

указывает возможные способы вывода выходного диапазона. В случае выбора Новый рабочий лист/Новая рабочая книга вывод данных начинается с ячейки А1.

7.4.1. Описательная статистика

Режим «Описательная статистика» служит для генерации одномерного статистического отчета по основным показателями положения, разброса и ассиметрии выборочной совокупности.

В диалоговом окне данного режима задаются следующие параметры:

Итоговая статистика – установить в активное состояние, если в выходном диапазоне необходимо получить по одному полю для каждого из следующих показателей описательной статистики: средняя арифметическая выборки, средняя ошибка выборки, медиана, мода, оценка стандартного отклонения по выборке, оценка дисперсии по выборке, оценка эксцесса по выборке, оценка коэффициента ассиметрии, размах вариации, минимальный и максимальный элементы выборки, сумма элементов выборки, количество элементов в выборке, k-й наибольший и k-й наименьший элементы выборки, предельная ошибка выборки.

Уровень надежности – установить в активное состояние, если в выходную таблицу необходимо включить строку для предельной ошибки выборки при установленном уровне надежности. (Значение уровня надежности 95% равносильно доверительной вероятности 0,95 или уровню значимости 0,05.)

К-й наибольший – установить в активное состояние, если в выходную таблицу необходимо включить строку для k-го наибольшего (начиная с максимума xmax) значения элемента выборки. Если к=1, то строка будет содержать максимальное значение элемента выборки.

К-й наименьший – установить в активное состояние, если в выходную таблицу необходимо включить строку для k-го наибольшего (начиная с минимума xmin) значения

41

элемента выборки. Если к=1, то строка будет содержать минимальное значение элемента выборки.

Пример: Стоимость набора из 25 продуктов питания по некоторым крупным городам центрального региона России приведена в таблице:

 

А

 

 

В

 

1

Стоимость

набора

из 25

продуктов

 

питания

по некоторым

городам

 

центрального региона России в декабре

 

1998 г., руб.

 

 

 

2

Владимир

 

384,04

3

Вологда

 

 

417,78

4

Иваново

 

 

394,00

5

Кострома

 

 

371,96

6

Москва

 

 

525,96

7

Нижний Новгород

 

405,12

8

Рязань

 

 

419,52

9

Тверь

 

 

401,93

10

Ярославль

 

418,97

Необходимо рассчитать основные показатели описательной статистики и сделать выводы. Для решения задачи используем режим работы «Описательная статистика». Установим значения параметров:

Показатели, рассчитанные в данном режиме:

 

А

 

В

14

Столбец1

 

 

15

 

 

 

16

Среднее

 

415,48

17

Стандартная

ошибка

14,85

18

Медиана

 

405,12

19

Мода

 

#Н/Д

20

Стандартное

отклонение

44,55

21

Дисперсия выборки

1984,30

22

Эксцесс

 

5,89

23

Асимметричность

2,22

 

 

 

 

42

24

Интервал

154,00

25

Минимум

371,96

26

Максимум

525,96

27

Сумма

3739,28

28

Счет

9,00

29

Наибольший(1)

525,96

30

Наименьший(1)

371,96

31

Уровень надежности(95,0%)

34,24

На основании проведенного выборочного исследования и рассчитанных по данной выборке показателей описательной статистики с уровнем надежности 95% можно предположить, что средняя стоимость набора из 25 продуктов питания в целом по всем городам центрального региона России находилась в пределах от 381,24 до 449,72 руб. Данный вывод основан на следующих показателях: средняя арифметическая выборки (Среднее) и предельная ошибка выборки (Уровень надежности). Из выражения доверительного интервала находим: 415,48-34,24= 381,24-левая граница, 415,48+34,24= 449,72 – правая граница.

Коэффициент вариации:

 

44,55

 

~ 100 %

 

10,6%

415,48

x

 

Полученное значение V свидетельствует о небольшой колеблемости признака в исследованной выборочной совокупности. Надежность средней выборки подтверждается также и ее незначительным отклонением от медианы: 415,48-405,12=10,36. Значительные положительные значения коэффициентов ассиметрии и эксцесса позволяют говорить о том, что данное эмпирическое распределение существенно отличается от нормального, имеет правостороннюю ассиметрию и характеризуется скоплением членов ряда в центре распределения.

43

8.Задачи для самостоятельного выполнения

8.1.Тема «Вариационный ряд. Графическое представление данных»

1.Составить таблицу распределения по частотам и относительным частотам случайной величины Х – роста студентов группы (см)

156,160,170,160,165,160,164,170,156,168,170,172,160,172,168,165,170,160,170,172.

Построить полигон относительных частот. Вычислить средний рост студентов.

2.Составить таблицу распределения по частотам и относительным частотам

случайной величины Х - веса студентов группы (кг)

60,64,59,65,70,70,70,59,60,60,60,64,65,64,58,58,60,65,65,64,64,70.

Построить полигон относительных частот. Вычислить среднее значение совокупности значений.

3.Составить таблицу распределения по частотам и относительным частотам

случайной величины Х – времени учащихся на дорогу от дома до школы (мин).

15,30,20,30,40,50,15,20,20,30,30,25,25,30,40,40,30,25,15,10,10,10,15,25.

Построить полигон относительных частот. Вычислить среднее значение совокупности значений.

4.При переписи населения, данные о возрасте (полном количестве лет) жильцов

некоторого дома оказались следующими:

20,41,40,25,33,50,25,40,40,50,33,50,10,25,10,33,50,12,38,75,61,61.

Составить таблицу распределения по частотам и относительным частотам полученных значений. Построить полигон относительных частот. Вычислить среднее значение совокупности значений.

8.2.Тема «Корреляционный и регрессионный анализ»

1.Изобразить корреляционное поле для следующих множеств:

Х=(2, 2, 3, 4, 4, 4, 5, 5, 5, 5, 7, 8, 9, 9);

Y=(1, 2, 2, 2, 3, 5, 6, 7, 7, 7, 8, 9, 10, 10)

Можно ли сказать, что связь между данными линейная? Положительная?

2. Вычислить коэффициент корреляции Пирсона для следующих данных:

Результаты в беге на 100 м (в сек), показанные группой школьников 10 класса (20 человек):

 

15.5

16.3

16.7

17.1

15.7

16.4

16.8

17.4

15.8

16.4

 

16.2

16.5

17.0

17.6

16.2

16.6

17.0

17.9

17.4

16.8

Результаты прыжка в высоту (в см)

 

 

 

 

 

 

 

100

95

100

105

105

110

95

100

80

85

 

90

105

90

100

90

95

100

110

105

95

Сделать выводы.

3. Вычислить ранговый коэффициент для данных из задачи 2.

a)Занести результаты измерений в таблицу и произвести соответствующие расчеты:

xi

dx

yi

dy

(dx-dy)

(dx-dy)2

 

 

 

 

 

 

 

 

 

 

(dx dy) 0

(dx dy)2

b)Рассчитать ранговый коэффициент корреляции по формуле:

n

6 * (dx dy)2

r

s

1

i 1

 

 

 

 

 

n(n2 1)

c) Сделать выводы.

44

4. Установить степень положительной линейной связи между длиной ног (x) и спортивным результатом (y) высококвалифицированных прыгунов в высоту по данным обследования 15 прыгунов, приведенным ниже с помощью коэффициента корреляции Браве-Пирсона.

Xi

92

93

94

94

95

95

96

97

98

98

98

99

100

101

101

yi

209

211

210

212

213

214

216

215

213

215

218

217

215

214

215

5.Вычислить для данных из задачи 4 коэффициент корреляции Спирмена.

6.Можно ли утверждать, что мнение двух судей, оценивающих на соревнованиях по

фигурному катанию выступления мужчин в обязательных упражнениях, были согласованными, если они поставили 9 участникам следующие оценки:

Судья 1

 

4,7

4,9

5,1

 

5,6

 

5,7

 

 

5,3

5,8

5,9

 

5,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Судья 2

 

4,3

4,5

5,3

 

5,2

 

5,5

 

 

5,5

5,9

5,6

 

5,7

 

 

7. Вычислить коэффициент корреляции Браве-Пирсона для гипотетических данных по

 

11 испытуемым:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xi

 

5,2

 

 

4,0

 

2,8

4,6

7,0

8,2

5,8

 

 

2,2

 

6,4

3,4

7,6

 

yi

 

10,0

 

8,56

 

4,21

9,64

6,76

1,0

9,64

 

1,0

 

8,56

6,76

4,24

 

Построить корреляционное поле и убедиться, что между данными существует функциональная взаимосвязь. Какую форму имеет зависимость?

Прокомментировать результаты.

8. В таблице приведены данные за 10 лет (1994-2003) по количеству вновь регистрируемых фирм (Х) и по количеству банкротств (Y) в некотором государстве:

год

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

 

 

 

 

 

 

 

 

 

 

 

X

72500

72900

74150

73500

78350

82500

87000

85500

90000

89000

 

 

 

 

 

 

 

 

 

 

 

Y

1020

1290

1830

2250

2500

3000

4000

4200

4500

4000

Какое ожидаемое количество вновь регистрируемых фирм можно ожидать в течение 2004 года согласно данным этого временного интервала; каковы стандартное отклонение и коэффициент вариации для этого показателя?

Каково ожидаемое количество банкротств в течение года можно ожидать в течение 2004 года согласно данным этого временного интервала; каковы стандартное отклонение и коэффициент вариации для этого показателя?

Вычислить коэффициент корреляции между X и Y.

Являются ли переменные X и Y независимыми? Если X и Y коррелированы, то можно ли утверждать, что один из этих показателей является следствием другого, то есть изменение одного влечет изменение другого?

9. Исследуется зависимость между количеством (N) покупателей в ювелирном магазине и количеством (Q) проданных товаров. За 10 дней наблюдений получены следующие данные:

дни

1

2

3

4

5

6

7

8

9

10

 

 

 

 

 

 

 

 

 

 

 

N

50

61

72

43

60

65

76

55

62

40

 

 

 

 

 

 

 

 

 

 

 

Q

10

12

20

9

15

15

21

14

18

7

 

 

 

 

 

 

 

 

 

 

 

Оценить наличие и степень связи зависимости между N и Q. Оценить параметры уравнения линейной регрессии. С помощью полученной функции спрогнозировать количество покупателей на три последующих дня (воспользоваться функцией ПРЕДСКАЗ).

10. Влияние рекламы на объем продаж. На основе статистических данных построить математическую модель зависимости объемов продаж от затрат на рекламу (однофакторная линейная модель). Численно оценить параметры модели. Вычислить

45

значения полученной теоретической функции модели. Построить графики практической и теоретической функций.

Затраты на рекламу (тыс.руб)

5

8

10

12

15

18

20

21

25

Объем продаж (у.е.)

16

7

11

24

21

30

32

33

32

8.3.Проверка статистических гипотез

1.Предполагается, что месячная зарплата сотрудников фирмы составляет 1000$ при стандартном отклонении 100$. Выборка из 36 человек дала следующие результаты: средняя зарплата 900$, выборочное стандартное отклонение 150.Можно ли по результатам

проведенных наблюдений утверждать, что средняя зарплата сотрудников фирмы меньше рекламируемой, а разброс в затратах больше? Какие критические области вы в этом случае использовали?

2. Расход бензина по паспортным данным автомобиля должен составлять 10 л на 100 км. На новую модель автомобиля устанавливается модернизированный двигатель, обеспечивающий расход 9 л на 100 км. Данное утверждение считается неверным, если средний расход бензина больше 9,4 л. Найти вероятности ошибок первого и второго вида, если решение принимается по выборке объемом равным 25.

3. Целью педагогического эксперимента, проводимого на базе двух средних школ города, была проверка эффективности новой программы обучения, обеспечивающей предположительно более рациональное распределение времени на выполнение задания.

В эксперименте участвовали две группы испытуемых (контрольная и экспериментальная) численностью по 10 человек каждая. В качестве одного из тестов для оценки уровня подготовленности использовалось контрольное упражнение на время его выполнения (мин). Ниже приведены результаты выполнения контрольного задания в обеих группах в начале педагогического эксперимента.

С помощью t– критерия Стьюдента проверить на уровне значимости α = 0,05 следующую гипотезу:.до проведения эксперимента обе группы по исследуемому признаку однородны (средние результаты в указанном тесте для обеих групп не имеют статистически значимого различия).

Варианты задания:

а).

КГ

12

10

 

9

 

10

 

9

 

9

11

 

10

10

14

ЭГ.

9

 

 

9

 

 

9

 

 

9

 

 

8

 

9

11

 

8

 

9

 

8

б).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

КГ

5

 

6

 

9

 

7

 

9

 

 

5

6

 

7

 

10

 

6

ЭГ.

5

 

9

 

9

 

9

 

8

 

 

9

8

 

8

 

9

 

8

в).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

КГ

 

12

 

14

 

12

 

10

 

11

 

 

13

11

 

10

 

10

 

14

ЭГ.

 

10

 

12

 

9

 

9

 

8

 

 

9

10

 

8

 

9

 

8

46

Задание для зачета

1.Определить объект для статистического исследования.

2.Выбрать два показателя (признака, параметра) для измерения

3.Получить массив статистических данных (выборку) из 20-25 значений для одного из показателей

4.Упорядочить данные

5.Вычислить среднее, моду, медиану, дисперсию и стандартное отклонение

6.Вычислить коэффициент вариации.

7.Разбить данные на интервалы, выбрав количество классов К=3. Вычислить размах варьирования R=Xmax-Xmin и ширину интервала H=R/K

8.Получить вариационный ряд

№ интервала

Границы

Серединные значения Частота Накопленная

 

интервала

частота

9.Построить гистограмму и полигон распределения.

10.Вычислить среднее взвешенное для полученного ряда

11.Сравнить значения средних

12.По полученным данным охарактеризовать выборку.

13.Получить массив данных для второго показателя. Построить корреляционное поле. Вычислить

коэффициент корреляции в соответствии со шкалой измерения показателей. Определить тесноту связи данных и направление связи.

Ответить на вопросы:

1.Есть ли у выборки меры центральной тенденции?

2.Представительна ли средняя выборки?

3.Является ли выборка однородной по составу данных?

4.В случае неоднородного состава значений выборки предложить группировку данных (с учетом вариационного ряда)

5.Можно ли в вашем случае сказать, что между показателями имеет место причинноследственная связь?

6.Охарактеризуйте связь между данными согласно полученного значения коэффициента корреляции

Литература

1.Катранов А.Г. Компьютерная обработка данных экспериментальных исследований: Уч.пособие.-СПб.:изд-воСПб ГУФК им.П.Ф.Лесгафта,2005.-132с.

2.Макарова Н.В., Трофимец В.Я. Статистика в Excel: Учеб.пособие.-М.:Финансы и статистика,2003.-386 с.

3.Сапегин А.Г.Психологический анализ в среде Excel. Математические методы и инструментальные средства.-М.:Ось-89,2005.-144с.

4.Цесарь И.Ф. Лабораторные работы на персональном компьютере. - М.: Изд-во

«Экзамен»,2004.-224с.

5.Элементы математической статистики. Учебно-методическая разработка/ Сост.Замогильнова Л.В.,Федосеев В.Н.-ШГПУ,1996.-38с.

6.Анализ статистических данных в среде Excel. Практическое руководство – Шуя: Изд-во «Весть» ГОУ ВПО «ШГПУ», 2008. – 48с.

47

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приложение

 

 

 

 

 

Критические значения двустороннего t-критерия Стьюдента

 

 

 

 

 

 

 

 

 

( - число степеней свободы)

 

 

 

 

 

 

 

 

 

 

Уровни значимости

 

 

 

 

Уровни значимости

 

 

 

0,1

 

 

0,05

 

0,01

 

0,001

 

 

 

0,1

 

0,05

 

0,01

 

0,001

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

6,314

 

12,706

63,657

 

636,619

 

16

 

1,746

 

2,120

 

2,921

4,015

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2,920

 

4,308

 

9,925

 

31,599

 

17

 

1,740

 

2,110

 

2,898

3,965

 

 

3

 

2,353

 

3,182

 

5,841

 

12,924

 

18

 

1,734

 

2,101

 

2,878

3,922

 

 

4

 

2,132

 

2,776

 

4,604

 

8,610

 

19

 

1,729

 

2,093

 

2,861

3,883

 

 

5

 

2,015

 

2,571

 

4,032

 

6,869

 

20

 

1,725

 

2,086

 

2,845

3,850

 

 

6

 

1,943

 

2,447

 

3,707

 

5,959

 

23

 

1,714

 

2,069

 

2,807

3,768

 

 

7

 

1,895

 

2,365

 

3,499

 

5,408

 

25

 

1,708

 

2,060

 

2,787

3,725

 

 

8

 

1,860

 

2,306

 

3,355

 

5,041

 

30

 

1,697

 

2,042

 

2,750

3,646

 

 

9

 

1,833

 

2,262

 

3,250

 

4,781

 

40

 

1,684

 

2,021

 

2,704

3,551

 

 

10

 

1,812

 

2,228

 

3,169

 

4,587

 

50

 

1,676

 

2,009

 

2,678

3,505

 

 

11

 

1,796

 

2,201

 

3,106

 

4,437

 

60

 

1,664

 

2,000

 

2,660

3,505

 

 

12

 

1,782

 

2,179

 

3,055

 

4,318

 

80

 

1,664

 

1,990

 

2,639

3,416

 

 

13

 

1,771

 

2,160

 

3,012

 

4,221

 

100

 

1,660

 

1,984

 

2,626

3,391

 

 

14

 

1,761

 

2,145

 

2,977

 

4,140

 

120

 

1,658

 

1,980

 

2,617

3,373

 

 

15

 

1,753

 

2,131

 

2,947

 

4,073

 

200

 

1,653

 

1,972

 

2,601

3,340

 

 

 

 

0,9

 

 

0,95

 

0,99

 

0,999

 

 

 

0,9

 

0,95

 

0,99

 

0,999

 

 

 

 

 

 

Доверительные уровни

 

 

 

 

Доверительные уровни

 

 

 

Критические значения F –критерия Фишера для уровня значимости =0,05

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

1 - степени свободы для большей дисперсии

 

 

 

 

 

1

 

2

3

 

4

 

 

 

5

 

6

 

7

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

10,1

 

9,6

9,3

 

9,1

 

 

9,0

 

8,9

 

8,9

 

8,8

 

4

 

7,7

 

6,9

6,6

 

6,4

 

 

6,3

 

6,2

 

6,1

 

6,0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

6,6

 

5,8

5,4

 

5,2

 

 

5,1

 

5,0

 

4,9

 

4,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

6,0

 

5,1

4,8

 

4,5

 

 

4,4

 

4,3

 

4,2

 

4,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

5,6

 

4,7

4,4

 

4,1

 

 

4,0

 

3,9

 

3,8

 

3,7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

5,3

 

4,5

4,1

 

3,8

 

 

3,7

 

3,6

 

3,5

 

3,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

5,1

 

4,3

3,9

 

3,6

 

 

3,5

 

3,4

 

3,3

 

3,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

5,0

 

4,1

3,7

 

3,5

 

 

3,3

 

3,2

 

3,1

 

3,1

 

20

 

4,4

 

3,5

3,1

 

2,9

 

 

2,7

 

2,6

 

2,5

 

2,5

 

30

 

4,2

 

3,3

2,9

 

2,7

 

 

2,5

 

2,4

 

2,3

 

2,3

48

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]