
- •1. Построить статистический ряд распределения, изобразить получившийся ряд графически с помощью полигона или гистограммы. Найти функцию распределения, построить ее график.
- •2. Найти: выборочную среднюю, выборочную дисперсию, среднее квадратическое отклонение выборки, моду и медиану.
- •4. Считая данные нормально распределенной случайной величиной найти:
- •1. Оценить степень зависимостн между переменными;
- •2. Найти уравнсние линейной регрессии;
- •3. Интерпретировать полученную модель, сделать выводы.
Задание 1. По имеющимся данным требуется;
1. Построить статистический ряд распределения, изобразить получившийся ряд графически с помощью полигона или гистограммы. Найти функцию распределения, построить ее график.
2. Найти: выборочную среднюю, выборочную дисперсию, среднее квадратическое отклонение выборки, моду и медиану.
3. Проверитъ при уровне значимости α = 0,05 гипотезу о соответствии
имеющегося статистического распределения нормальному закону.
4. Считая данные нормально распределенной случайной величиной найти:
а) точечную оценку математического ожидания изучаемой совокупности;
б) доверительный интервал для математического ожидания с доверительной
вероятностью 0,95.
Имеются данные о стаже работы сотрудников предприятия, лет
9 |
8 |
15 |
11 |
9 |
18 |
1 |
21 |
17 |
3 |
2 |
12 |
15 |
6 |
26 |
17 |
3 |
11 |
12 |
14 |
10 |
9 |
12 |
19 |
12 |
5 |
7 |
4 |
15 |
18 |
11 |
10 |
16 |
8 |
6 |
19 |
12 |
11 |
10 |
20 |
1. Для удобства проранжируем полученные данные и составим вариационный ряд, т.е. расположим их в порядке возрастания:
1, 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 9, 9, 9, 10, 10, 10, 11,11, 11, 11, 12, 12, 12, 12, 12, 14,
15, 15, 15, 16, 17, 17, 18, 18, 19, 19, 20, 21, 26.
Так как число значений случайной величины Х – «стаж работы сотрудников предприятия» – достаточно велико (22 значения), то построим интервальный статистический ряд.
Определим: хmin = 1, xmax = 26; объем выборки n = 40.
По формуле Стерджесса при n = 40 находим длину частичного интервала:
Принимаем
h
= 4. Тогда
. Но так как стаж работы не может быть
отрицательной величиной, принимаем
хнач
= 0.
Число интервалов m = 1 + 3,32lgn = 1 + 3,32lg40 = 6,3 ≈ 6.
Исходные данные разбиваем на 6 интервалов: [0, 4), [4, 8), [8, 12), [12, 16),
[16, 20), [20, 24), [24, 28)
Подсчитав
число сотрудников (частоту ni),
попавших в каждый из полученных
интервалов, и вычислив для каждого
интервала частость
, построим интервальный статистический
ряд (таблица 1):
Таблица 1
xi – xi+1 |
0 – 4 |
4 – 8 |
8 – 12 |
12 – 16 |
16 – 20 |
20 – 24 |
24 – 28 |
Частота ni |
4 |
5 |
12 |
9 |
7 |
2 |
1 |
Частость
|
0,1 |
0,125 |
0,3 |
0,225 |
0,175 |
0,05 |
0,025 |
Контроль: 0,1+0,125+0,3+0,225+0,175+0,05+0,025 = 1
Построим гистограмму, отложив по оси абсцисс интервалы, а по оси ординат – частости.
По полученным результатам находим функцию распределения F*(x).
Очевидно,
что для
имеем
F*(x)
= 0, так как ni
= 0. Подсчитаем значения функции F*(x)
в виде «наращенной относительной
частоты» и составим таблицу 2.
Таблица 2
Стаж |
(-∞, 0) |
[0, 4) |
[4, 8) |
[8, 12) |
[12, 16) |
[16, 20) |
[20, 24) |
[24, 28) |
F*(x) |
0 |
0,100 |
0,225 |
0,525 |
0,750 |
0,925 |
0,975 |
1,000 |
По полученным результатам строим график функции распределения
2. Для нахождения числовых характеристик выборки в качестве представителей каждого интервала возьмем их середины (таблица 3).
Таблица 3
Интервалы |
0 – 4 |
4 – 8 |
8 – 12 |
12 – 16 |
16 – 20 |
20 – 24 |
24 – 28 |
Середина интервала xi |
2 |
6 |
10 |
14 |
18 |
22 |
26 |
Частота ni |
4 |
5 |
12 |
9 |
7 |
2 |
1 |
Частость |
0,1 |
0,125 |
0,3 |
0,225 |
0,175 |
0,05 |
0,025 |
Накопленная
частота
|
4 |
9 |
21 |
30 |
37 |
39 |
40 |
Выборочная средняя определяется как среднее арифметическое полученных при выборки значений:
=
2·0,1 + 6·0,125 + 10·0,3 + 14·0,225 + 18·0,175 + 22·0,05 +
26·0,025 = 12
Выборочная дисперсия вычисляется по одной из формул:
Dв = (2–12)2·0,1 + (6–12)2·0,125 + (10–12)2·0,3 + (14–12)2·0,225 + (18–12)2·0,175 +
+ (22–12)2·0,05 + (26–12)2·0,025 = 32,8
Выборочное среднее квадратическое отклонение равно:
Мода М0 – варианта, имеющая наибольшую частоту, для интервального статис-тического ряда вычисляется по формуле:
где
-
начало модального интервала;
-
частота модального интервала;
- частота интервала, предшествующего
модальному;
- частота интервала, следующего за
модальным.
Тогда:
Медиана Ме – значение признака (варианта), приходящееся на середину вариаци-онного ряда, для интервального статистического ряда вычисляется по формуле:
где
-
начало медианного интервала;
-
частота медианного интервала;
- накопленная частота интервала,
предшествующего медианного.
Медианным интервалом является интервал (8 – 12), для него Sn = 21 > n/2 = 20, а для предшествующего интервала (4 – 8) Sn = 9 < n/2. Тогда:
3. Число значений случайной величины Х (частота) в крайних интервалах меньше 5, поэтому объединяем их с соседними (таблица 4).
Таблица 4
Интервалы |
0 – 8 |
8 – 12 |
12 – 16 |
16 – 26 |
Середина интервала xi |
4 |
10 |
14 |
21 |
Частота ni |
9 |
12 |
9 |
10 |
Частость |
0,225 |
0,3 |
0,225 |
0,25 |
Вычислим выборочные среднюю, дисперсию и среднее квадратическое отклонение:
= 4·0,225 + 10·0,3 + 14·0,225 + 21·0,25 =12,3
Dв = (4–12,3)2·0,225 + (10–12,3)2·0,3 + (14–12,3)2·0,225 + (21–12,3)2·0,25 = 36,66
Находим вероятности рi (i = 1;4). При распределении случайной величины Х по нормальному закону с параметрами (а, σ) на интервале (-∞, +∞), то крайние интервалы в ряде распределения заменяем соответственно на (-∞, 8) и (16, +∞).
Тогда
вероятность попадания Х
в интервал
вычисляется по формуле:
где Ф(х)
– функция Лапласа.
Контроль: 0,2389+0,2412+0,2490+0,2709 = 1
Полученные результаты сводим в таблицу 5
Таблица 5
xi – xi+1 |
-∞ – 8 |
8 – 12 |
12 – 16 |
16 – +∞ |
ni |
9 |
12 |
9 |
10 |
|
9,56 |
9.65 |
9,96 |
10,84 |
Вычисляем
:
т.е.
Находим
число степеней свободы: по выборке
рассчитаны два параметра, значит, r
= 2. Количество
интервалов m
= 4. Следовательно, k
= 4 – 2 – 1 =1. При
α = 0,05 и k
= 1 по таблице
распределения
находим
.
Так как
,
то нет оснований отвергнуть проверяемую
гипотезу.
4. а) По методу моментов при нормальном распределении случайной величины Х теоретический начальный момент I порядка приравниваем эмпирическому моменту I порядка: v1 = Мэ.
Так
как v1
равно математическому ожиданию (v1
= Мх),
а
,
то
,
т.е. точечной оценкой математического
ожидания является средняя выборочная.
б) Доверительный интервал для математического ожидания нормально распреде-ленной случайной величины при неизвестной дисперсии определяется неравен-ством:
где
S
– исправленное среднее квадратическое
отклонение случайной величины Х,
вычисленное по выборке:
;
tγ
– коэффициент, опреде-ляемый по таблице
квантилей распределения Стьюдента в
зависимости от дове-рительной вероятности
γ
и числа степеней свободы n–1.
По данным таблицы 3 имеем: = 12, находим S:
По таблице значений tγ для γ = 0,95 и n–1=39 имеем tγ = 2,023. Тогда:
Задание 2. По приведенным ниже данным требуется: