3.3. Точечные и интервальные оценки параметров распределения

Пример 23. С целью определения среднего трудового стажа на предприятии методом случайной повторной выборки проведено обследование трудового стажа рабочих. Из всего коллектива рабочих завода случайным образом выбрано 400 рабочих, данные о трудовом стаже которых и составили выборку. Средний по выборке стаж оказался равным 9,4 года. Считая, что трудовой стаж рабочих имеет нормальный закон распределения, определить с вероятностью 0,97 границы, в которых окажется средний трудовой стаж для всего коллектива, если известно, что  = 1,7 года.

Решение. Признак Х – трудовой стаж рабочих. Этот признак имеет нормальный закон распределения с известным параметром  = 1,7, параметр а неизвестен. Сделана выборка объемом n = 400, по данным выборки найдена точечная оценка параметра а: _в = 9,4. С надежностью  = 0,97 найдем интервальную оценку параметра по формуле:

По таблице значений функции Лапласа из уравнения Ф(t)  = 0,485 находим t=2,17; тогда:

9,4 – 0,18 < _ген < 9,4 + 0,18. Итак, 9,22 < _ген < 9,58, то есть средний трудовой стаж рабочих всего коллектива лежит в пределах от 9,22 года до 9,58 года (с надежностью  = 0,97).

С изменением надежности  изменится и интервальная оценка.

Пусть  = 0,99, тогда Ф(t) = 0,495, отсюда t = 2,58. Тогда:

или 9,4 – 0,22 < _ген < 9,4 + 0,22 .

Окончательно: 9,18 < _ген < 9,62.

Пример 24. С целью определения средней продолжительности рабочего дня на предприятии методом случайной повторной выборки проведено обследование продолжительности рабочего дня сотрудников. Из всего коллектива завода случайным образом выбрано 30 сотрудников. Данные табельного учета о продолжительности рабочего дня этих сотрудников и составили выборку. Средняя по выборке продолжительность рабочего дня оказалась равной 6,85 часа, а S = 0,7 часа. Считая, что продолжительность рабочего дня имеет нормальный закон распределения, с надежностью  = 0,95 определить, в каких пределах находится действительная средняя продолжительность рабочего дня для всего коллектива данного предприятия.

Решение. Признак Х – продолжительность рабочего дня. Признак имеет нормальное распределение с неизвестными параметрами. Сделана выборка объемом n = 30, по выборочным данным найдены точечные оценки параметров распределения: _в= 6,85; S = 0,7. С надежностью  = 0,95 найдем интервальную оценку параметра по формуле:

t_ находим по таблице (прил. 8), t_= t(0,95; 30) = 2,045. Тогда:

, или 6,85 – 0,26 < _ген < 6,85 + 0,26 .

Итак, 6,59 < _ген < 7,11 , то есть с надежностью  = 0,95 средняя продолжительность рабочего дня для всего коллектива лежит в пределах от 6,59 до 7,11 ч.

4. Корреляционно-регрессионный анализ

Пример 25. Для нормирования труда проведено статистическое исследование связи между количеством изготавливаемых изделий (Х, шт.) и затратами времени на обработку одного изделия (Y, мин). Сделана выборка объемом n = 51 и получены следующие данные: r_в = 0,8 , = 8, _x = 3,2 , = 40, _y= 8. Проверить значимость коэффициента корреляции при  = 0,02. Построить уравнение регрессии.

Решение. Признак Х – количество изготавливаемых изделий, шт. Признак Y – затраты времени на обработку одного изделия, мин.

Предполагаем, что признаки имеют нормальный закон распределения. Они находятся в статистической зависимости, так как затраты времени зависят не только от количества изготавливаемых изделий, но и от многих других факторов, которые в данном случае не учитываются. В данном случае связь линейная, теснота связи характеризуется линейным коэффициентом корреляции r_в = 0,8. Но прежде чем делать вывод о тесноте взаимосвязи, необходимо проверить значимость коэффициента корреляции. Выдвигаем нулевую гипотезу и ей конкурирующую:

Н₀: r_ген = 0,

Н₁: r_ген  0.

Проверяем нулевую гипотезу с помощью случайной величины, имеющей распределение Стьюдента с k = n – 2 = 49 степенями свободы: .

По выборочным данным найдем наблюдаемое значение критерия Т_набл =  9,33. По таблице критических точек распределения Стьюдента находим t_{крит.дв}(, k) = t_{крит.дв}(0,02; 49) = 2,40. Сравниваем Т_набл и t_{крит.дв}(0,02; 49). Так какТ_набл  t_{крит.дв}(0,02; 49), то есть наблюдаемое значение критерия попало в критическую область, нулевая гипотеза отвергается, справедлива конкурирующая гипотеза: r_ген  0, признаки Х и Y коррелированны, r_в значим.

D =  100 % = 64 % , то есть вариация затрат времени на обработку одного изделия в среднем на 64 % объясняется за счет вариации количества изготавливаемых изделий.