
- •Задача 1. Обработка результатов наблюдений
- •Построить вариационный (статистический) ряд:
- •Построить для полученного вариационного ряда гистограмму и эмпирическую функцию распределения:
- •Оценить точность выборки.
- •Проверить согласованность теоретического и статистического распределений, используя критерий Пирсона.
- •Задача 2. Статистический анализ связей
- •Список использованной литературы:
Построить для полученного вариационного ряда гистограмму и эмпирическую функцию распределения:
Установим в диалоговом окне программы Гистограмма дополнительно флажки «Интегральный процент» для построения эмпирической функции распределения и «Вывод графика» для построения гистограммы частот. Получим:
Гистограмма частот наглядно отражает особенности интервального вариационного ряда, в частности позволяет предположить, что величина Х (стаж работы) распределена по нормальному закону.
Эмпирическая функция распределения (интегральный процент) показывает, какова доля сотрудников, стаж работы которых оказался меньше указанной величины («карман»). Так, например, для 5% сотрудников стаж работы менее 2,2 лет; для 80% сотрудников – менее 10,2 лет.
Определить выборочные оценки числовых характеристик случайной величины: выборочную среднюю, медиану, моду, дисперсию, выборочное среднее квадратическое отклонение, коэффициент вариации, коэффициент асимметрии и коэффициент эксцесса.
Для определения числовых характеристик случайной величины Х воспользуемся сервисом Данные / Анализ данных / Описательная статистика (использование программы требует размещения исходных данных в одном столбце). Для получения результатов следует установить флажок «Итоговая статистика».
В результате получим:
Коэффициент
вариации определим по формуле
= 0,358. Средние величины (среднее, медиана,
мода) характеризуют значение признака,
вокруг которого концентрируются
наблюдения – центральную тенденцию
распределения:
-
средняя величина стажа работ по организации составила
= 7,856 лет.;
-
медиана, равная 7,8 лет показывает стаж работ сотрудников: для 50% сотрудников стаж работ не больше, чем 7,856 лет, а для 50% – не меньше, чем 7,856 лет;
-
мода равна 3,6
Наиболее важными
показателями вариации (рассеяния)
наблюдений вокруг средней величины
являются дисперсия выборки S2
= 12,86; выборочное среднее квадратическое
(стандартное) отклонение S
= 3,5; коэффициент вариации
= 35,8%. Невысокая величина коэффициента
вариации
свидетельствует об однородности
значений признака Х
(стаж работы).
Коэффициент асимметрии составил –0,1.
Коэффициент эксцесса равен -0,1. Близкое к нулю значение говорит о том, что рассматриваемое распределение по крутости приближается к нормальной кривой.
Оценить точность выборки.
Примем уровень
значимости
.
С помощью функции ДОВЕРИТ определим
ошибку выборки – размах доверительного
интервала для математического ожидания
генеральной совокупности:
= 0,7.
Нижняя и верхняя
границы доверительного интервала для
математического ожидания генеральной
совокупности равны соответственно
=7,8-0,7=7,1
и
=7,8+0,7=8,5.
Таким образом, с надежностью 95% средняя
величина стажа работ по организации
заключена в границах от 7,1 до 8,5 лет.
Для оценки точности
выборки рассчитаем относительную ошибку
= 0,7/7,8=8% и сделаем вывод в соответствии
со схемой:
На уровне значимости
точность выборки следует признать
удовлетворительной.
Провести выравнивание статистического ряда с помощью нормального закона распределения, в качестве параметров использовать выборочные оценки математического ожидания и среднего квадратического отклонения. Показать на одной диаграмме гистограмму эмпирических частот и теоретическую нормальную кривую.
Для проведения вычислений подготовим таблицу. Занесем в нее границы ai и bi интервалов группировки, середины xi этих интервалов, соответствующие частоты ni.
Построим интегральную
функцию нормального распределения с
параметрами
и
.
Используем функцию НОРМРАСП; для каждого
интервала в качестве значения, для
которого строится распределение, укажем
верхнюю границу bi.
Для последнего интервала занесем в
таблицу значение
.
Определим
теоретические вероятности
попадания нормально распределенной
величины в i-ый
интервал группировки (для первого
интервала укажем
).
Рассчитаем
теоретические частоты
,
соответствующие интервалам группировки.
Проверим выполнение условия
.
ai |
bi |
xi |
ni |
Ф(х) |
рi теор |
ni теор |
0,2 |
2,2 |
1,2 |
6 |
0,05744 |
0,05744 |
5,743985 |
2,2 |
4,2 |
3,2 |
14 |
0,154072 |
0,096632 |
9,66318 |
4,2 |
6,2 |
5,2 |
12 |
0,322178 |
0,168106 |
16,81063 |
6,2 |
8,2 |
7,2 |
23 |
0,538197 |
0,216019 |
21,60187 |
8,2 |
10,2 |
9,2 |
19 |
0,743251 |
0,205054 |
20,50542 |
10,2 |
12,2 |
11,2 |
17 |
0,887035 |
0,143784 |
14,3784 |
12,2 |
14,2 |
13,2 |
5 |
0,961504 |
0,07447 |
7,446962 |
14,2 |
16,2 |
15,2 |
2 |
0,989989 |
0,028484 |
2,848433 |
16,2 |
18,2 |
17,2 |
2 |
0,998033 |
0,008044 |
0,804443 |
суммы |
|
|
100 |
|
|
100 |
Покажем на одной диаграмме гистограмму частот и нормальную кривую:
Диаграмма показывает
соответствие гистограммы частот и
нормальной кривой с параметрами
и
.