
- •Предисловие
- •Введение
- •1 Первичная обработка статистических данных.
- •1.1 Проверка данных
- •1.2 Группировка статистических данных
- •1.3 Графическое представление статистических данных
- •1.4 Задача 1. Первичная обработка
- •2 Точечные оценки параметров распределения.
- •2.1 Несгруппированные статистические данные
- •2.2 Статистические дискретный и интервальный ряды
- •2.3 Метод “условного нуля”
- •2.2.4 Задача 1. Точечные оценки
- •Выборочное среднее квадратическое отклонение равно
- •Выборочное среднее квадратическое отклонение равно
- •3 Интервальные оценки параметров распределения
- •3.1 Доверительные интервалы для некоторых параметров распределения
- •3.2 Примеры построения доверительных интервалов
- •4 Проверка статистических гипотез
- •4.1 Сравнение двух дисперсий нормально распределенных генеральных совокупностей
- •4.2 Сравнение двух математических ожиданий нормально распределенных генеральных совокупностей, дисперсии которых неизвестны и одинаковы
- •4.3 Сравнение двух вероятностей биномиальных распределений
- •4.4 Проверка гипотезы о виде распределения генеральной совокупности по критерию Пирсона
- •4.5 Проверка гипотезы о виде распределения генеральной совокупности по критерию Колмогорова-Смирнова
- •4.6 Примеры
- •Выборочное среднее квадратическое отклонение равно
- •5 Элементы корреляционного и регрессионного анализа
- •5.1 Корреляционное поле
- •5.2 Эмпирическая ломаная регрессии
- •5.3 Эмпирический коэффициент детерминации и эмпирическое корреляционное отношение
- •5.4 Линейная регрессия
- •5.5 Проверка коэффициента корреляции на значимость.
- •5.6 Теоретический коэффициент детерминации и теоретическое корреляционное отношение
- •5.7 Нелинейная корреляция
- •5.8 Множественная регрессия
- •5.9 Оценка погрешности модели
- •5.10 Задача 1. Установления корреляционной зависимости
- •Реализация статистических расчетов при помощи компьютера
- •6.1 Табличный процессор Microsoft Excel
- •6.2 Пакет программ statistica
- •Задачи для самостоятельного решения
- •Вариант № 1
- •Вариант № 2
- •Вариант № 3
- •Вариант № 4
- •Вариант № 5
- •Вариант № 6
- •Вариант № 7
- •Вариант № 8
- •Вариант № 9
- •Вариант № 10
- •Вариант № 11
- •Вариант № 12
- •Вариант № 13
- •Вариант № 14
- •Вариант № 15
- •Вариант № 16
- •Вариант № 17
- •Вариант № 18
- •Вариант № 19
- •Вариант № 20
- •Вариант № 21
- •Вариант № 22
- •Вариант № 23
- •Вариант № 24
- •Вариант № 25
- •Вариант № 26
- •Вариант № 27
- •Вариант № 28
- •Вариант № 29
- •Вариант № 30
- •8. Контрольные задания по статистике для студентов дневной формы обучения
- •Основные вопросы теории математической статистики
- •Типы отборов и виды выборок.
- •8.2 Варианты контрольных работ Вариант № 1
- •Вариант № 2
- •Вариант № 3
- •Вариант № 4
- •Вариант № 5
- •Вариант № 6
- •Вариант № 7
- •Вариант № 8
- •Вариант № 9
- •Вариант № 10
- •Семестровые задания по статистике
- •9.1 Условие семестрового задания для студентов дневной формы обучения
- •9.2 Условие контрольной работы по статистике для студентов заочной формы обучения
- •9.3 Варианты заданий вариант 1
- •Вариант 2
- •Вариант 3
- •Пример выполнения контрольной работы по статистике для студентов заочной формы обучения
- •Выборочное среднее квадратическое отклонение равно
- •Выборочное среднее квадратическое отклонение равно
- •Приложения !!!! в отдельном файле “ Приложения” Рекомендуемая литература
Выборочное среднее квадратическое отклонение равно
1,19
Вычислим исправленную выборочную дисперсию
S
2 =
1,4458
Вычислим исправленное выборочное среднее квадратическое отклонение:
1,2024.
Обозначим
результат S
x
= 1,2 .
Полученные результаты позволяют сделать следующие выводы.
Средняя скорость подвигания очистного забоя по выборке равна 2,5 м/сут. Средний разброс скорости подвигания очистного забоя вокруг среднего по выборке равен 1,2 м/сут.
Б) Аналогично определяем числовые характеристики выборки по признаку У . Выберем условный нуль С = 109 ; h = 14.
i |
интервалы |
уi |
ni |
ui |
ni ui |
ni ui2 |
ni (ui + 1)2 |
1 |
60 - 74 |
67 |
10 |
-3 |
-30 |
90 |
40 |
2 |
74 - 88 |
81 |
9 |
-2 |
-18 |
36 |
9 |
3 |
88-102 |
95 |
10 |
-1 |
-10 |
10 |
0 |
4 |
102-116 |
109 |
6 |
0 |
0 |
0 |
6 |
5 |
116-130 |
123 |
5 |
1 |
5 |
5 |
20 |
6 |
130-144 |
137 |
4 |
2 |
8 |
16 |
36 |
7 |
144-158 |
151 |
5 |
3 |
15 |
45 |
80 |
итого |
|
|
49 |
|
-30 |
202 |
191 |
Проверка: 191 = 202 + 2·(–30) + 49 – верно.
Из таблицы находим условные моменты:
М1 = -30/49 = –0,6122;
М2 = 202/49 = 4,1224;
Выборочная средняя
равна:
= –0,612214
+ 109 = 100,43
Выборочная дисперсия равна:
Dв = [M2 - (M1)2]·h2 = [4,1224 – (-0,6122)2]·142 = 734,5306
Выборочное среднее квадратическое отклонение равно
=27,1022.
S
2 =
749,8333
27,383
. Обозначим
результат S
у
= 27,383 .
Полученные результаты позволяют сделать следующие выводы.
Средняя величина опускания кровли по выборке равна 100,43 мм. Средний разброс величины опускания кровли вокруг среднего по выборке равен 27,383мм.
Проверим гипотезу о нормальном распределении признака Х. Выдвинем гипотезы
Н0: Признак Х подчиняется нормальному закону распределения
Н1: Признак Х не подчиняется нормальному закону распределения
Для проверки гипотез используем критерий Пирсона. В качестве исходных данных берем интервальный ряд признака Х, полученный в п1. решения данной задачи и характеристики выборки признака Х, найденные в п.:
=2,5; Sx =1,2
Далее заполним таблицу по формулам:
z i = (х i – )/Sх ; z i+1 = (х i+1 – )/Sх .
Теоретические частоты найдем по формуле: ni*=n[Ф(zi+1) – Ф(zi)], где функция Ф(z) вычисляется по таблице.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Х i |
Х i+1 |
n i |
z i |
z i+1 |
Ф(z i) |
Ф(zi+1) |
ni* |
N i* |
N i |
В i |
V i |
0.8 |
1.4 |
14 |
– |
-0,92 |
-0.5 |
-0.3203 |
8.8033 |
8.8033 |
14 |
3.0677 |
22.2644 |
1.4 |
2 |
7 |
-0.92 |
-0.42 |
-0.3203 |
-0.1615 |
7.7813 |
7.7813 |
7 |
0.0785 |
6.2971 |
2 |
2.6 |
5 |
-0.42 |
0.08 |
-0.1615 |
0.0332 |
9.5425 |
9.5425 |
5 |
2.1624 |
2.6198 |
2.6 |
3.2 |
7 |
0.08 |
0.58 |
0.0332 |
0.2202 |
9.1610 |
9.1610 |
7 |
0.5098 |
5.3488 |
3.2 |
3.8 |
6 |
0.58 |
1.08 |
0.2202 |
0.3607 |
6.8847 |
6.8847 |
6 |
0.1137 |
5.2290 |
3.8 |
4.4 |
8 |
1.08 |
1.58 |
0.3607 |
0.4433 |
4.0502 |
6.8272 |
10 |
1.4745 |
14.6473 |
4.4 |
5 |
2 |
1,58 |
+ |
0.4433 |
0.5000 |
2.7770 |
|
|
|
|
Итого |
|
46 |
|
|
|
|
49 |
|
49 |
7.4065 |
56.4065 |
После заполнения 8–го столбца отмечаем, что два последних элемента в этом столбце меньше пяти. Поскольку в критерии Пирсона требуется, чтобы в каждом интервале было не меньше пяти единиц, то объединим частоты трех последних интервалов Ni* – для 8–го столбца; Ni – для 3–го столбца.
11–ый столбец заполняем по формуле: Вi = .
12–ый столбец – контрольный. Он вычисляется по формуле: Vi =
Сделаем проверку: 49 + 7,4065 = 56,4065. Верно.
Запишем наблюдаемое значение критерия: 2набл = 7,4065.
Выберем уровень значимости ошибки =0,01.
Число степеней свободы равно k = l – 3 , где l – число интервалов после объединения. В нашем случае число интервалов после объединения l =5. Тогда число степеней свободы равно k = 5 – 3 = 2. По таблице критических точек 2 находим 2кр(0,05; 2) = 6,0.
Сравниваем: 2набл > 2кр .
Следовательно, необходимо отвергнуть гипотезу о нормальном законе распределения признака Х .
Для признаков X и Y построим корреляционное поле в системе координат ХОУ, используя исходную таблицу.
Корреляционное поле на данном рисунке характеризуется набором из 49 точек, причем можно заметить, что с увеличением Х признак У в среднем убывает. Анализ полученного поля рассеяния позволяет предполагать наличие прямой корреляционной зависимости между признаками Х и У.
6. Уравнение линейной регрессии имеет вид: у = кх + b, где параметры к и b определяются по методу наименьших квадратов из условия минимального отклонения исходных точек корреляционного поля от прямой регрессии. Параметры к и b вычисляются по формулам:
Для расчета этих величин заполним таблицу.
номер |
X |
Y |
х2 |
у2 |
ху |
1 |
0,8 |
140 |
0,64 |
19600 |
112 |
2 |
0,8 |
154 |
0,64 |
23716 |
123,2 |
3 |
1 |
124 |
1 |
15376 |
124 |
4 |
1 |
140 |
1 |
19600 |
140 |
5 |
1 |
154 |
1 |
23716 |
154 |
6 |
1,2 |
124 |
1,44 |
15376 |
148,8 |
7 |
1,2 |
134 |
1,44 |
17956 |
160,8 |
8 |
1,2 |
146 |
1,44 |
21316 |
175,2 |
9 |
1,2 |
158 |
1,44 |
24964 |
189,6 |
10 |
1,4 |
104 |
1,96 |
10816 |
145,6 |
11 |
1,4 |
114 |
1,96 |
12996 |
159,6 |
12 |
1,4 |
124 |
1,96 |
15376 |
173,6 |
13 |
1,4 |
134 |
1,96 |
17956 |
187,6 |
14 |
1,4 |
146 |
1,96 |
21316 |
204,4 |
15 |
1,6 |
82 |
2,56 |
6724 |
131,2 |
16 |
1,6 |
102 |
2,56 |
10404 |
163,2 |
17 |
1,6 |
126 |
2,56 |
15876 |
201,6 |
18 |
1,8 |
114 |
3,24 |
12996 |
205,2 |
19 |
2 |
94 |
4 |
8836 |
188 |
20 |
2 |
106 |
4 |
11236 |
212 |
21 |
2 |
124 |
4 |
15376 |
248 |
22 |
2,2 |
76 |
4,84 |
5776 |
167,2 |
23 |
2,2 |
108 |
4,84 |
11664 |
237,6 |
24 |
2,4 |
84 |
5,76 |
7056 |
201,6 |
25 |
2,4 |
96 |
5,76 |
9216 |
230,4 |
26 |
2,6 |
88 |
6,76 |
7744 |
228,8 |
27 |
2,8 |
74 |
7,84 |
5476 |
207,2 |
28 |
2,8 |
94 |
7,84 |
8836 |
263,2 |
29 |
2,8 |
104 |
7,84 |
10816 |
291,2 |
30 |
3 |
86 |
9 |
7396 |
258 |
31 |
3,2 |
74 |
10,24 |
5476 |
236,8 |
32 |
3,2 |
96 |
10,24 |
9216 |
307,2 |
33 |
3,6 |
64 |
12,96 |
4096 |
230,4 |
34 |
3,6 |
74 |
12,96 |
5476 |
266,4 |
35 |
3,6 |
96 |
12,96 |
9216 |
345,6 |
36 |
4 |
62 |
16 |
3844 |
248 |
37 |
4 |
84 |
16 |
7056 |
336 |
38 |
4,4 |
66 |
19,36 |
4356 |
290,4 |
39 |
4,4 |
94 |
19,36 |
8836 |
413,6 |
40 |
4,8 |
80 |
23,04 |
6400 |
384 |
41 |
3,1 |
99 |
9,61 |
9801 |
306,9 |
42 |
3,6 |
65 |
12,96 |
4225 |
234 |
43 |
3,5 |
68 |
12,25 |
4624 |
238 |
44 |
3,3 |
96 |
10,89 |
9216 |
316,8 |
45 |
4,1 |
60 |
16,81 |
3600 |
246 |
46 |
4 |
84 |
16 |
7056 |
336 |
47 |
4,4 |
60 |
19,36 |
3600 |
264 |
48 |
4,4 |
94 |
19,36 |
8836 |
413,6 |
49 |
4,8 |
79 |
23,04 |
6241 |
379,2 |
Итого |
126,2 |
4949 |
396,64 |
536679 |
11425,7 |
Отсюда получим:
Следовательно, параметры уравнения регрессии равны:
Окончательно, уравнение линейной регрессии имеет вид :
у = –18,501х + 148,65 .
Определим выборочный коэффициент корреляции по формуле
r = kSx / Sy . Получим r = – 0,815.
Проверим коэффициент корреляции на значимость.
Основная гипотеза H 0 :, rг = 0
Конкурирующая гипотеза H 0 : rг 0.
Для проверки гипотезы H 0 вычислим наблюдаемое значение критерия:
Тнабл
–
9,64
По таблице критических точек распределения Стьюдента найдем критическое значение критерия при уровне значимости ошибки = 0,05 и числе степеней свободы k = n – 2 = 49 – 2 = 47 :
tкр = tкр (0,05; 47) = 2,01. Сравнивая, получим, что Тнабл > tкр .
Следовательно, нулевую гипотезу следует отвергнуть. Это значит, что коэффициент корреляции значимо отличается от нуля, и признаки Х и У коррелированы.
Найдем коэффициент детерминации, который для случая линейной регрессии равен квадрату коэффициента корреляции: R = r2 . Получим:
R2 = (–0,815)2 = 0,66. Он говорит о том, что 66% вариации величины опускания кровли объясняется вариацией скорости подвигания очистного забоя. Для определения типа связи между признаками используем шкалу Чеддока.
Для нашего случая R2 = 0,66. Поэтому на основании шкалы Чеддока делаем вывод о том, что между величиной опускания кровли и скоростью подвигания очистного забоя существует заметная связь.
8. По уравнению регрессии у = –18,501х + 148,65 построим прямую в той же системе координат, что и корреляционное поле. С этой целью рассчитаем координаты двух точек: х1 =1 ; у1 = 130,2
х2 = 4 , у2 = 74,7
Построим точки на графике и соединим их прямой. Получим линию регрессии.
Вычислим погрешности уравнения регрессии.
а) Абсолютная погрешность уравнения равна:
Sур
=
15,879
б) Относительная погрешность уравнения равна:
Отсюда видно, что относительная ошибка вычислений по полученному уравнению регрессии составляет 15,7%.
Используем полученное уравнение регрессии для точечного прогноза У при X = 1,5 м/сут .
упрогноз = –18,5011,5 + 148,65 = 120,91 мм.
Следовательно, при скорости подвигания очистного забоя 1,5 м/сут величина опускания кровли прогнозируется равной 120,91 мм. Ошибка прогноза составляет не более 15,7% .