- •Глава 6 статистические показатели
- •Понятие, формы выражения и виды статистических показателей
- •6.2 Абсолютные показатели
- •6.3 Относительные показатели
- •Сущность и значение средних показателей
- •Средняя арифметическая и ее свойства
- •Продажа акций ао «Дока-хлеб» на торгах фондовой секции тмб «Гермес»
- •Заработная плата работников предприятия за май 2002 г.
- •Другие виды средних
- •Валовой сбор и урожайность зерновых культур по Уральскому федеральному округу в 2000 г.
- •Основные понятия
- •Аналитическая статистика
- •Глава 7 показатели вариации и анализ .Частотных распределений
- •Вариация признака в совокупности и значение ее изучения
- •Доля мальчиков, родившихся у матерей до 45 лет
- •Показатели центра распределения
- •Распределение рабочих по тарифному разряду
- •Распределение коммерческих банков по сроку функционирования
- •Вычисление о2 и а по несгруппированным данным
- •Вариации альтернативного признака. Энтропия распределения
- •Виды дисперсий в совокупности, разделенной на группы. Правило сложения дисперсий
- •2. Определим средние объемы выполненных работ по предприятиям каждой формы собственности:
- •5. Найдем общую дисперсию по правилу сложения дисперсий:
- •Удельный вес основных рабояях фирмы
- •Структурные характеристики вариационного ряда распределения. Показатели дифференциации
- •Распределение оценок учеников за диктант при 100-балльной оценке*
- •7.7 Моменты распределения
- •7.8 Изучение формы распределения
- •Распределение коммерческих банков по размеру выданных кредитов
- •Теоретические распределения в анализе вариационных рядов
- •Расчет критерия Колмогорова поданным крепости одиночной нити в 500 образцах
- •Основные понятия
Теоретические распределения в анализе вариационных рядов
Для аппроксимации (выравнивания) эмпирических кривых распределения и сопоставления их с теоретическими в статистике часто пользуются нормальным распределением, функция которого равняется
(7.75)
где у, - ордината кривой нормального распределения;
t = x~x - стандартизованное отклонение;
о сия - математические постоянные;
х - варианты вариационного ряда;
л - их средняя величина;
О - среднее квадратическос отклонение.
Нормальное распределение полностью определяется двумя параметрами - средней арифметической (х) и средним квадратическим отклонением о. Подчиненность закону нормального распределения проявляется тем точнее, чем больше случайных величин действуют вместе. Если ни одна из случайно действующих причин по своему действию не окажется преобладающей над другими, то закон распределения очень близко подходит к нормальному.
Такая закономерность проявляется, например, в распределении отклонений в производственном процессе при нормальном уровне организации и технологии, в распределении населения определенного возраста по размеру обуви и т.д.
268
Часто возникают распределения, хотя и не отвечающие строго нормальному распределению, но имеющие с ним сходство. Такие сходные черты часто обусловлены тем, что крайние значения вариантов, близкие к х^ и х^, встречаются много реже, чем серединные.
Рассмотрим некоторые свойства кривой нормального распределения:
• ЛО - функция нормального распределения - четная, т.е../(-()3=
=У(+(). Следовательно, изображающая ее кривая распределена симметрично относительно оси ординат, т.е. х == Мо = Me;
• функция имеет бесконечно малые значения при f = ±°о. Это означает, что ветви кривой удалены в бесконечность и асимптотически приближаются к оси абсцисс. При этом чем больше значения признака отклоняются от х, тем реже встречаются;
• функция имеет максимум при (= О.Отсюда следует, что модального значения кривая достигает при / = 0 или при х = х. Величина максимума составляет l / -Tin ;
• при ( = ±1 функция дает точки перегиба. Следовательно, при отклонении значений признака (х) от среднего значения (х) в положительном и отрицательном направлениях на одно стандартное (нормированное) отклонение (±0 от х) кривая дает пе-. реход от выпуклости к вогнутости;
• если случайная величина представляет сумму двух независимых случайных величин, следующих каждая нормальному закону, то она тоже следует нормальному закону;
• площадь между кривой и осью о/ равна единице, как интеграл
Пуассона.
Пример. Рассмотрим данные распределения образцов крепости одиночной нити (табл. 7.16).
Поскольку нормальное распределение зависит от двух параметров: х и о, прежде всего определим соответствующие характеристики.
В графах 1 и 2 табл.7.16 приведены фактические варианты и частоты. Расчет х и о произведен обычным способом.
Для расчета частот нормального распределения 500 образцов крепости нити со средней х = 64,66 г и средним квадратическим отклонением О = 3,1 г необходимо использовать формулу плотности вероятности:
(7.76)
269
Чтобы прийти к частотам нормального распределения^, необходимо выразить их через Р^.
Для удобства вычислений вероятностей случайные величины нормируются, а затем используются заранее табулированные значения плотности функции распределения нормированной случайной величины. Первый множитель такой функции - величина постоянная для
- KLf 2-500 ,„, _.,__,
данного распределения. В нашем случае: —— =—— = 322,6, во вто-о 3,1
ром множителе выражение х-х обозначим через /, тогда получим:
о
Полученную функцию от t обозначим^):
(7.77)
В математической статистике существуют специальные таблицы для любых значений fit) (приложение 8).
KLf
Таким образом, /т = —- • /(0 очень легко рассчитать, определив о
у _ у
для каждого значения варианта х' величину г = —— (графа 5) и най-
о дя по таблицам соответствующие fif) (графа 6). Умножив fit) на по-
klf стоянный для всех частот множитель ——, получим теоретические
о частоты нормального распределения /^(графа 7).
Сравнивая полученные /„ (графа 7) с фактическими частотами/ (графа 2), убеждаемся, что их расхождения невелики. На графике, представленном на рис.7.7, видна довольно большая близость фактических частот распределения к теоретическим.
271
Рис. 7.7. Эмпирические и теоретические данные распределения крепости одиночной нити в 500 образцах
В то же время нельзя не отметить, что сопоставление графика эмпирических частот с теоретическими в целях определения соответствия эмпирического распределения нормальному позволяет оценивать эти расхождения только субъективно. Объективная характеристика соответствия может быть получена с помощью особых статистических показателей - критериев согласия. Известны критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, А.Н. Колмогорова и Б.С. Ястремского.
Критерий согласия Пирсона (х2) вычисляется по формуле:
(7.78)|
где /з и/,, - эмпирические и теоретические частоты соответственно. '272
С помощью величины у1 по специальным таблицам приложения 3 определяется вероятность Р(х2)- Входами в таблицу являются значения 5С2 и число степеней свободы у = п - 1. На основе Р выносится суждение о существенности или несущественности расхождения между эмпирическим и теоретическим распределением. При Р > 0,5 считается, что эмпирическое и теоретическое распределения близки, при Р е [0,2; 0,5] совпадение между ними удовлетворительное, в остальных случаях - недостаточное.
Если число степеней свободы большое, то применяется соотношение, равное \2х - ^/2у-1 . Расхождение между эмпирическим и теоретическим распределениями существенно при значениях этой
разности, заметно превосходящих 2.
Критерий Романовского (С), также используемый для проверки близости эмпирического и теоретического распределений, определяется следующим образом:
(7.79)
где х2 - критерий Пирсона, рассчитываемый по формуле (7.78);
7 - число степеней свободы (при проверке гипотезы о нормальности распределения равно числу групп минус три).
При С < 3 различие несущественно, что позволяет считать эмпирическое распределение близким к нормальному.
Критерий Ястремского (L) может быть найден на основе следующего соотношения:
(7.80)
Где N - объем совокупности;
pq - дисперсия альтернативного признака;
К - число вариантов или групп;
Q - принимает значение 0,6 при числе вариантов или групп от 8 до 20.
279
Если L > 3, то эмпирическое распределение соответствует теоретическому.
Критерий Колмогорова (k) вычисляется по формуле:
(7.81)
где D
максимальное значение разности между накопленными эмпирическими и теоретическими частотами;
•' If — сумма эмпирических частот.
Необходимым условием использования этого критерия является достаточно большое число наблюдений (не меньше ста).
Рассмотрим применение критерия Колмогорова (табл. 7.17).
Пример. Как видно из табл. 7.17, максимальное значение разности между эмпирическими и теоретическими частотами составляет 7, т.е. D = 1.
Следовательно, величина критерия Колмогорова в нашем случае равна:
По специальным таблицам вероятностей Р(\) определяем, что \ соответствует Р(х), близкой к 1,000. Это означает, что с вероятностью, близкой к 1, можно утверждать, что отклонения фактических частот от теоретических в нашем примере являются случайными. Следовательно, в основе фактического распределения образцов по крепости нити лежит закон нормального распределения.
В статистике широко используются различные виды теоретических распределений, кроме нормального распределения, - биномиальное распределение, распределение Пуассона и др. Каждое из теоретических распределений имеет специфику и свою область применения в различных отраслях знания.
Рассмотрение других видов распределения, кроме нормального, не является предметом изучения в данной главе.
274
Таблица 7.17