- •Лабораторная работа № 1 первичная обработка данных
- •1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке неубывания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.
- •Порядок выполнения работы
- •Контрольные вопросы
- •Варианты заданий для лабораторНых работ по математической статистике
- •Задание для факультета пгс для лабораторных работ 1- 2
Лабораторная работа № 1 первичная обработка данных
Цель работы: ознакомиться с основными понятиями математической статистики и методикой проведения первичного исследования статистических данных.
Задание: При проведении экспериментов фиксировались значения случайной величины X, характеризующей стоимость строительно-монтажных работ на участке, у.е.. Произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х.
Пример выполнения лабораторной работы №1.
1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке неубывания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.
Таблица 1.1 – Расчетная таблица
Номер п/п |
Выборка, у.е. |
Вариацион-ный
ряд, у.е., |
|
|
|
|
1 |
4,265 |
3,95 |
-0,229 |
5,24E-02 |
-1,20E-02 |
2,7501E-03 |
2 |
4,136 |
4,07 |
-0,109 |
1,19E-02 |
-1,30E-03 |
1,4116E-04 |
3 |
4,174 |
4,09 |
-0,089 |
7,92E-03 |
-7,05E-04 |
6,2742E-05 |
4 |
4,2 |
4,09 |
-0,089 |
7,92E-03 |
-7,05E-04 |
6,2742E-05 |
5 |
4,24 |
4,09 |
-0,089 |
7,92E-03 |
-7,05E-04 |
6,2742E-05 |
6 |
4,238 |
4,098 |
-0,081 |
6,56E-03 |
-5,31E-04 |
4,3047E-05 |
7 |
4,2 |
4,1 |
-0,079 |
6,24E-03 |
-4,93E-04 |
3,8950E-05 |
8 |
4,16 |
4,1 |
-0,079 |
6,24E-03 |
-4,93E-04 |
3,8950E-05 |
9 |
4,2 |
4,1 |
-0,079 |
6,24E-03 |
-4,93E-04 |
3,8950E-05 |
10 |
4,231 |
4,108 |
-0,071 |
5,04E-03 |
-3,58E-04 |
2,5412E-05 |
11 |
4,19 |
4,136 |
-0,043 |
1,85E-03 |
-7,95E-05 |
3,4188E-06 |
12 |
4,294 |
4,137 |
-0,042 |
1,76E-03 |
-7,41E-05 |
3,1117E-06 |
13 |
4,1 |
4,137 |
-0,042 |
1,76E-03 |
-7,41E-05 |
3,1117E-06 |
14 |
4,15 |
4,138 |
-0,041 |
1,68E-03 |
-6,89E-05 |
2,8258E-06 |
15 |
4,31 |
4,15 |
-0,029 |
8,41E-04 |
-2,44E-05 |
7,0728E-07 |
16 |
4,21 |
4,15 |
-0,029 |
8,41E-04 |
-2,44E-05 |
7,0728E-07 |
17 |
4,19 |
4,156 |
-0,023 |
5,29E-04 |
-1,22E-05 |
2,7984E-07 |
18 |
4,137 |
4,156 |
-0,023 |
5,29E-04 |
-1,22E-05 |
2,7984E-07 |
19 |
4,22 |
4,156 |
-0,023 |
5,29E-04 |
-1,22E-05 |
2,7984E-07 |
20 |
4,18 |
4,16 |
-0,019 |
3,61E-04 |
-6,86E-06 |
1,3032E-07 |
21 |
4,168 |
4,167 |
-0,012 |
1,44E-04 |
-1,73E-06 |
2,0736E-08 |
22 |
4,214 |
4,168 |
-0,011 |
1,21E-04 |
-1,33E-06 |
1,4641E-08 |
23 |
4,137 |
4,174 |
-0,005 |
2,50E-05 |
-1,25E-07 |
6,2500E-10 |
24 |
4,314 |
4,18 |
0,001 |
1,00E-06 |
1,00E-09 |
1,0000E-12 |
25 |
4,09 |
4,185 |
0,006 |
3,60E-05 |
2,16E-07 |
1,2960E-09 |
26 |
4,233 |
4,19 |
0,011 |
1,21E-04 |
1,33E-06 |
1,4641E-08 |
27 |
4,156 |
4,19 |
0,011 |
1,21E-04 |
1,33E-06 |
1,4641E-08 |
28 |
4,15 |
4,19 |
0,011 |
1,21E-04 |
1,33E-06 |
1,4641E-08 |
29 |
4,21 |
4,19 |
0,011 |
1,21E-04 |
1,33E-06 |
1,4641E-08 |
30 |
4,09 |
4,2 |
0,021 |
4,41E-04 |
9,26E-06 |
1,9448E-07 |
31 |
4,2 |
4,2 |
0,021 |
4,41E-04 |
9,26E-06 |
1,9448E-07 |
32 |
4,325 |
4,2 |
0,021 |
4,41E-04 |
9,26E-06 |
1,9448E-07 |
33 |
4,09 |
4,2 |
0,021 |
4,41E-04 |
9,26E-06 |
1,9448E-07 |
34 |
4,07 |
4,208 |
0,029 |
8,41E-04 |
2,44E-05 |
7,0728E-07 |
35 |
4,19 |
4,21 |
0,031 |
9,61E-04 |
2,98E-05 |
9,2352E-07 |
36 |
4,271 |
4,21 |
0,031 |
9,61E-04 |
2,98E-05 |
9,2352E-07 |
37 |
4,156 |
4,214 |
0,035 |
1,23E-03 |
4,29E-05 |
1,5006E-06 |
38 |
4,167 |
4,22 |
0,041 |
1,68E-03 |
6,89E-05 |
2,8258E-06 |
39 |
4,1 |
4,225 |
0,046 |
2,12E-03 |
9,73E-05 |
4,4775E-06 |
40 |
4,138 |
4,231 |
0,052 |
2,70E-03 |
1,41E-04 |
7,3116E-06 |
41 |
4,208 |
4,233 |
0,054 |
2,92E-03 |
1,57E-04 |
8,5031E-06 |
42 |
4,234 |
4,234 |
0,055 |
3,02E-03 |
1,66E-04 |
9,1506E-06 |
43 |
4,1 |
4,238 |
0,059 |
3,48E-03 |
2,05E-04 |
1,2117E-05 |
44 |
4,185 |
4,24 |
0,061 |
3,72E-03 |
2,27E-04 |
1,3846E-05 |
45 |
4,098 |
4,265 |
0,086 |
7,40E-03 |
6,36E-04 |
5,4701E-05 |
46 |
4,19 |
4,271 |
0,092 |
8,46E-03 |
7,79E-04 |
7,1639E-05 |
47 |
4,156 |
4,294 |
0,115 |
1,32E-02 |
1,52E-03 |
1,7490E-04 |
48 |
4,225 |
4,31 |
0,131 |
1,72E-02 |
2,25E-03 |
2,9450E-04 |
19 |
4,108 |
4,314 |
0,135 |
1,82E-02 |
2,46E-03 |
3,3215E-04 |
50 |
3,95 |
4,325 |
0,146 |
2,13E-02 |
3,11E-03 |
4,5437E-04 |
Итого |
208,948 |
208,948 |
0 |
0,24109
|
-0,006191
|
0,004725028
|
2) Найдем размах
выборки
= 4,325-3,95 = 0,375у.е.
3) Вычислим длину
интервала
=
=
0,056.
4) Границы интервалов:
=
3,95,
=
3,95+0,056 = 4,006,
=
4,006+0,056 = 4,062,
=
4,062+0,056 =4,118,
=
4,118+0,056=4,174,
=4,174+0,056=4,23,
=
4,23+0,056=4,286,
=4,286+0,056
=4,342
.
5) Построим интервальный статистический ряд:
Таблица 1.2 – Интервальный статистический ряд
Границы интервалов
|
Частоты
|
Частости
|
[3,95, 4,006] |
ч |
1/50 |
(4,006 , 4,062] |
0 |
0/50 |
(4,062, 4,118] |
9 |
9/50 |
(4,118, 4,174] |
13 |
13/50 |
(4,174, 4,23] |
17 |
17/50 |
(4,23, 4,286] |
6 |
6/50 |
(4,286, 4,342] |
4 |
4/50 |
итого |
50 |
1 |
6) Вычислим числовые характеристики.
В качестве оценки
математического
ожидания
используется среднее арифметическое
наблюденных значений. Эта статистика
называется выборочным
средним.
.
По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.
.
Для определения
выборочного значения медианы используется
вариационный
ряд. В нашем
случае объем выборки
=
50 – четное число, т.е. в качестве оценки
медианы примем
=
.
В качестве оценки
дисперсии используется статистика
=
.
Оценка среднего квадратического отклонения
=
Оценка коэффициента
вариации
.
Оценка коэффициента
асимметрии
.
Оценка коэффициента эксцесса
.
7) Построим гистограмму частот.
Рисунок 1.3 – Гистограмма частот
8) Построим
интервальные оценки для неизвестных
истинных значений
и
.
Объем выборки
составил n
= 50. Требуется с доверительной вероятностью
определить интервальные оценки:
а) для средней стоимости строительно-монтажных работ на участке;
б) для дисперсии стоимости строительно-монтажных работ на участке;
в) для среднего квадратического отклонения стоимости строительно-монтажных работ на участке.
а) Средняя стоимость
строительно-монтажных работ на
участкехарактеризуется генеральной
средней a.
Требуется найти интервальную оценку
параметра a
с доверительной вероятностью
.
Применяем формулу
,
где
,
,
,
,
значение
определяем по таблицам распределения
Стьюдента для
и
.
.
Подставим найденные значения в формулу:
у.е.
Таким образом, с
вероятностью
можно гарантировать, что средняя
стоимость строительно-монтажных работ
на участкенаходится в пределах:
.
б) определим интервальную оценку для дисперсии стоимости строительно-монтажных работ на участке.
Интервальная оценка дисперсии
.
По таблице процентных
точек
-распределения
(см. приложение Г) найдем
;
.
Следовательно,
.
Значит с доверительной вероятностью можно утверждать, что истинное значение дисперсии будет находиться в интервале
в) С доверительной вероятностью можно утверждать, что истинное значение среднего квадратического отклонения будет находиться в интервале
7) Произведем первичную обработку полученной выборки с помощью ЭВМ:
Summary Statistics for Col_1
Count |
50 |
Average |
127,16 |
Median |
128,0 |
Mode |
134,0 |
Variance |
440,056 |
Standarddeviation |
20,9775 |
Coeff. ofvariation |
16,4969% |
Minimum |
85,0 |
Maximum |
183,0 |
Range |
98,0 |
Stnd. skewness |
0,276588 |
Stnd. kurtosis |
-0,251092 |
Рисунок1.4 – Компьютерныйрасчет
Confidence Intervals for Col_1
95,0% confidence interval for mean: 127,16 +/- 5,96175 [121,198; 133,122]
95,0% confidence interval for standard deviation: [19,0704; 29,7078]
The StatAdvisor
This pane displays 95,0% confidence intervals for the mean and standard deviation of Col_1. The classical interpretation of these intervals is that, in repeated sampling, these intervals will contain the true mean or standard deviation of the population from which the data come 95,0% of the time. In practical terms, we can state with 95,0% confidence that the true mean Col_1 is somewhere between 121,198 and 133,122, while the true standard deviation is somewhere between 17,5232 and 26,1408.
Вывод. В результате
исследования выборки значений непрерывной
случайной величины, характеризующей
стоимость
строительно-монтажных
работ на участке, получили следующие
результаты, у.е: минимальная стоимость
строительно-монтажных работ на участке –
85, максимальная – 183, средняя стоимость
строительно-монтажных работ на участке–
127,16, наиболее вероятная стоимость
строительно-монтажных работ на участке –
134, средневероятная стоимость
строительно-монтажных работ на участке –
128, среднеквадратическое отклонение
стоимости строительно-монтажных работ
на участкеот среднего значения составило
20,978. Оценка коэффициента вариации
составила 16,5%, что указывает на
небольшуюколеблемость признака
относительно среднего значения, оценка
коэффициента асимметрии составила
0,090, оценка коэффициента эксцесса
составила -0,329. С доверительной
вероятностью
можно гарантировать, что средняя
стоимость строительно-монтажных работ
на участкенаходится в пределах:
,
истинное значение дисперсии будет
находиться в интервале
,
истинное значение среднего квадратического
отклонения
будет находиться в интервале

,
у.е.