задачи
.pdfСредняя из внутригрупповых дисперсий (остаточная) (σ 2 ) выражает внутригрупповую вариацию для всей совокупности, рассчитывается как средняя арифметическая из групповых дисперсий:
|
|
|
m |
|
|
|
|
|
∑σ 2j |
* N j |
(5.18) |
σ 2 = |
j=1 |
|
|||
|
|
||||
N |
|
|
|||
|
|
|
|
|
Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:
|
|
|
(5.19) |
σ общ2 = σ 2 + δ 2 |
Таким образом, общая дисперсия складывается из двух слагаемых: первое измеряет вариацию внутри частей совокупности, а второе – вариацию между средними этих частей.
Коэффициент детерминации (η 2 ) показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки:
η 2 |
= |
δ 2 |
(5.20) |
σ 2 |
|
||
|
|
общ |
|
Эмпирическое корреляционное отношение (η ) показывает, насколько тесно связаны исследуемое явление и группировочный признак:
|
|
|
|
|
|
|
|
(5.21) |
|
|
η = |
δ 2 |
|
|
|||
|
|
σ 2 |
|
|
||||
|
|
|
|
|
общ |
|
|
|
|
|
|
|
|
|
|
|
Таблица 5.4 |
|
Качественная оценка связи между признаками |
|
||||||
|
|
|
|
|
|
|
|
|
η |
0,1-0,3 |
0,3-0,5 |
|
|
0,5-0,7 |
0,7-0,9 |
0,9-0,99 |
|
Сила связи |
слабая |
умеренная |
|
заметная |
тесная |
весьма тесная |
Характеристики закономерности рядов распределения
Рассеивание кривой распределения по оси абсцисс является показателем колеблемости признака: чем более рассеяна кривая, тем больше колеблемость признака. Кривые распределения бывают симметричными и асимметричны-
71
ми. В зависимости от того, какая ветвь кривой вытянута − правая или левая, − различают правостороннюю или левостороннюю асимметрию.
Для симметричных распределений частоты любых двух вариант, равноотстоящих в обе стороны от центра, равны между собой. Рассчитанные для та-
ких рядов распределений характеристики равны: х =Мо=Ме; R=6*σ; σ=1,25*d. Если указанные соотношения нарушены, то это свидетельствует о наличии асимметрии распределения. Так, при Мо>Ме> х разности между х −Мо и х −Ме положительные и асимметрия правосторонняя, а при Мо<Ме< х разности между х −Мо и х −Ме отрицательные и асимметрия левосторонняя.
Относительный показатель асимметрии (Аs):
|
|
|
или |
А = |
|
|
(5.22) |
||
А = |
x |
− Mo |
, |
|
x |
− Me |
|||
s |
|
σ |
|
s |
|
|
σ |
|
|
|
|
|
|
|
|
|
Коэффициент асимметрии равен отношению центрального момента 3-го порядка (µ3 ) к среднему квадратическому отклонению в кубе (σ 3 ):
А = |
µ3 |
(5.23) |
σ 3 |
|
|
s |
|
Если Аs>0, то асимметрия правосторонняя, а если Аs<0, то асимметрия левосторонняя. Принято считать, что асимметрия выше 0,5 (независимо от знака) значительна, если она меньше 0,25, то незначительна.
Центральный момент к-го порядка рассчитывается по формуле:
|
|
∑(xi − |
|
)к |
|
|
|
|
|
|
|
∑(xi |
− |
|
)к * fi |
|
|
|
|
x |
|
|
|
|
|
|
x |
(5.24) |
|||||||
µк |
= |
i |
; |
|
|
|
µк |
= |
|
i |
|
|
|
|
|||
n |
|
|
|
|
∑ fi |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|||
|
(простой) |
|
|
|
|
|
|
(взвешенный) |
|
||||||||
Оценка существенности Аs проводится на основе средней квадратической |
|||||||||||||||||
ошибки, которая зависит от числа наблюдений (n): |
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(5.25) |
|
|
|
|
|
σ Аs |
= |
|
6*(n −1) |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
(n +1)*(n + 3) |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Если As > 3, асимметрия существенна и распределение признака в гене-
σ Аs
ральной совокупности несимметрично.
72
Для определения асимметрии можно воспользоваться упрощенной формулой, предложенной Линдбергом:
Аs=Р−50, |
(5.26) |
где Р − удельный вес (%) количества тех вариант, которые превосходят среднюю арифметическую, в общем количестве вариант данного ряда; 50 − удельный вес (%) вариант, превосходящих среднюю арифметическую ряда нормального распределения.
Для симметричных одновершинных распределений рассчитывается показатель эксцесса (Ек), который является показателем островершинности распре-
деления: |
|
|
|
|
|
|
Е |
|
= |
|
µ4 |
− 3 |
(5.27) |
к |
σ 4 |
|
||||
|
|
|
|
Если (Ек)>0, то распределение относится к островершинным, а если (Ек)<0 − к плосковершинным.
Линдбергом предложен следующий показатель эксцесса:
Ек=Р−38,29, (5.28) где Р − доля (%) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения в ту и другую сторону от средней; 38,29 − доля (%) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения, в общем количестве вариант ряда нормального распределения.
Характеристика соответствия эмпирических и теоретических кривых распределения может быть получена с помощью критериев согласия.
Критерий согласия Пирсона (χ2) вычисляется по формуле:
χ 2 = |
(f |
Э |
− f |
Т |
)2 |
, |
(5.29) |
|
|
fТ |
|
|
|
||
|
|
|
|
|
|
|
где fэ и fт – эмпирические и теоретические частоты соответственно. Критерий Колмогорова (λ) вычисляется по формуле:
73
λ = |
|
D |
|
, |
(5.30) |
|
|
|
|
||
∑ f |
|
где D – максимальное значение разности между накопленными эмпирическими и теоретическими частотами; ∑f − сумма эмпирических частот.
Необходимым условием использования критерия Колмогорова является достаточно большое число наблюдений (не меньше ста).
Задача 5.1
Количественно измерить закономерность распределения можно с помощью статистических характеристик: а) центра распределения; б) вариации; в) асимметрии и эксцесса.
Ответы: 1) а, б; 2) а, б, в; 3) б, в; 4) а, в.
Задача 5.2
Вариация представляет собой: а) различия индивидуальных значений ка- кого-либо признака внутри совокупности; б) различия значений нескольких признаков у отдельной единицы совокупности.
Ответы: 1) а; 2) б; 3) а, б; 4) −.
Задача 5.3
Среднее значение признака в двух совокупностях одинаково. Может ли быть различной вариация признака в этих совокупностях? а) да; б) нет. Средние значения признака в двух совокупностях неодинаковы. Может ли быть различной вариация признака в этих совокупностях? а) да; б) нет.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
Задача 5.4
Для сравнения вариации двух признаков необходимо использовать: 1) среднее линейное отклонение; 2) среднее квадратическое отклонение; 3) размах вариации; 4) коэффициент вариации.
Ответы: 1; 2; 3; 4.
74
Задача 5.5
Для измерения вариации групповых средних используют: а) межгрупповую дисперсию; б) групповые дисперсии. Для измерения вариации индивидуальных значений признака внутри выделенных групп используют: в) общую дисперсию; г) среднюю из групповых дисперсий.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
Задача 5.6
Выполнение плана поставки овощей предприятиями области за август и сентябрь характеризуется следующими данными (%):
август − 106; 133; 87; 111; 102; 121; сентябрь − 98; 105; 101; 104; 109; 107. Выполнение плана поставки овощей было более равномерно: 1) в августе; 2) в сентябре; 3) равномерность выполнения плана поставки в сентябре такая
же, как и в августе; 4) сравнить равномерность выполнения плана поставки овощей нельзя.
Ответы: 1; 2; 3; 4.
Задача 5.7
Распределение оценок, полученных студентами двух групп на экзамене по высшей математике, характеризуется следующими данными:
Оценка на экзамене, балл |
Численность студентов в группе |
|
|
Ι |
ΙΙ |
2 |
4 |
2 |
3 |
9 |
16 |
4 |
9 |
7 |
5 |
3 |
0 |
Средний балл выше: а) в Ι группе; б) во ΙΙ группе. Более ровная успеваемость студентов: в) в Ι группе; г) во ΙΙ группе.
Ответы: 1) а, в; 2) а, г; 3) б, в; 4) б, г.
Задача 5.8
Если все значения признака уменьшить в 10 раз, то дисперсия: 1) не изменится; 2) уменьшится в 10 раз; 3) уменьшится в 100 раз; 4) изменение дисперсии предсказать нельзя.
Ответы: 1; 2; 3; 4.
75
Задача 5.9
Известны данные о затратах времени на обслуживание одного покупателя работниками магазина:
Работники |
1-й |
2-й |
3-й |
4-й |
5-й |
6-й |
7-й |
8-й |
Затраты времени, мин. |
6 |
10 |
8 |
15 |
12 |
9 |
12 |
8 |
Вычислите: 1) среднее время, затраченное продавцами на обслуживание одного покупателя; 2) размах вариации; 3) среднее линейное отклонение; 4) дисперсию; 5) среднее квадратическое отклонение; 6) коэффициент осцилляции.
Решение оформите в таблице. Сформулируйте выводы.
Задача 5.10
Известно распределение предприятий по численности персонала:
Численность персонала, чел. |
Количество предприятий |
До 20 |
30 |
20 – 40 |
28 |
40 – 60 |
18 |
60 – 80 |
14 |
Свыше 80 |
10 |
Итого: |
100 |
Определите: 1) дисперсию; 2) среднее квадратическое отклонение; 3) коэффициент вариации. Решение представьте в таблице. Сформулируйте выводы относительно однородности совокупности.
Задача 5.11
Выполнение норм выработки рабочими двух бригад предприятия строительного вида деятельности за истекший месяц характеризуется следующими данными (%):
1 бригада |
110 |
127 |
92 |
113 |
101 |
134 |
2 бригада |
107 |
104 |
100 |
99 |
105 |
103 |
Укажите, в какой бригаде большее различие между рабочими по степени выполнения норм выработки.
Задача 5.12
Средняя урожайность зерновых в двух районах области за 2006-2011 гг. характеризуется следующими данными (ц/га):
76
Год |
2006 г. |
2007 г. |
2008 г. |
2009 г. |
2010 г. |
2011 г. |
|
|
|
|
|
|
|
1-й район |
28 |
33 |
20 |
22 |
18 |
25 |
2-й район |
30 |
29 |
28 |
32 |
30 |
31 |
Рассчитайте среднее линейное отклонение и на его основе − коэффициент среднего линейного отклонения. Укажите, в каком районе урожайность зерновых более устойчива.
Задача 5.13
Распределение численности работников двух предприятий по возрасту характеризуется следующими данными (% к итогу):
Возраст, лет |
Предприятие 1 |
Предприятие 2 |
До 25 |
9,0 |
14,1 |
25−35 |
34,9 |
20,3 |
35−45 |
35,6 |
22,7 |
45−50 |
8,1 |
18,8 |
50−55 |
7,3 |
17,5 |
55−60 |
4,0 |
4,5 |
60 и старше |
1,1 |
2,1 |
Итого |
100 |
100 |
Укажите, в каком предприятии вариация возраста работников больше.
Задача 5.14
Известны следующие выборочные данные о распределении населения области по размерам вклада в Сберегательном банке Российской Федерации:
Размер вклада, тыс. руб. |
До 700 |
700−800 |
800−900 |
900−1000 |
1000 и выше |
Число вкладов |
20 |
80 |
170 |
100 |
30 |
Для измерения вариации размера вклада используйте среднее квадратическое отклонение и коэффициент вариации. Объясните экономический смысл этих показателей вариации.
Задача 5.15
Распределение работниц по сменной выработке тканей характеризуется следующими данными:
|
|
|
|
|
|
|
Выработка ткани, м2 |
До 55 |
55−65 |
65−75 |
75−85 |
85−95 |
95−105 |
Число работниц |
5 |
15 |
20 |
35 |
15 |
10 |
|
|
|
|
|
|
|
По этим данным определите среднюю сменную выработку работниц и следующие показатели вариации: 1) среднее линейное отклонение и на его основе коэффициент среднего линейного отклонения; 2) среднее квадратическое
77
отклонение и на его основе коэффициент вариации. Объясните различия в показателях вариации, рассчитанных в пунктах 1 и 2.
Задача 5.16
Известно распределение студентов 4 групп направления подготовки «Экономика» по количеству часов, затрачиваемых на домашнюю работу:
Количество часов |
До 1 |
1−2 |
2−3 |
3−4 |
4−5 |
5−6 |
Всего |
Число студентов |
3 |
16 |
42 |
30 |
8 |
1 |
100 |
Вычислите по этим данным: 1) дисперсию количества часов, затрачиваемых на домашнюю работу двумя способами: обычным и по формуле х2 − (х)2 . Какой способ оказался более рациональным? 2) дисперсию доли студентов, затрачивающих на домашнюю работу от двух до пяти часов. Чем вызваны различия в технике расчета этих дисперсий?
Задача 5.17
Средний размер вклада в банке города увеличился с 350 тыс. руб. в 2000 г. до 1200 тыс. руб. в 2011 г. Среднеквадратическое отклонение размера вкладов увеличилось соответственно с 70 до 80 тыс. руб. Изменилась ли относительная вариация?
Задача 5.18
По имеющимся данным о наличии отдельной квартиры у работников предприятия определите среднее значение и дисперсию альтернативного признака:
Семейное |
Имеется отдельная |
Отсутствует отдельная |
Итого |
|
положение |
квартира |
квартира |
||
|
||||
Семейные |
750 |
50 |
800 |
|
Одинокие |
50 |
150 |
200 |
|
Итого |
800 |
200 |
1000 |
Задача 5.19
По данным хронометражных наблюдений затраты времени на обработку десяти деталей КС-II на строгальных станках составляют (мин):
В I смену |
26 |
24 |
23 |
28 |
25 |
24 |
Во II смену |
28 |
30 |
29 |
33 |
− |
− |
78
Для измерения внутрисменной и общей вариации затрат времени на обработку деталей KC-II используйте общую и среднюю из групповых дисперсий. Отличаются ли эти дисперсии и почему?
Задача 5.20
Известны данные о распределении магазинов по числу работников:
Группы магазинов |
№ магазина |
Оборот, млн. руб. |
|
по числу работников, чел. |
|||
|
|
||
|
1 |
1,9 |
|
|
2 |
1,7 |
|
До 10 |
3 |
1,8 |
|
|
4 |
1,6 |
|
|
5 |
2,0 |
|
Итого по группе |
5 |
9,0 |
|
|
6 |
2,6 |
|
10−20 |
7 |
2,4 |
|
|
8 |
3,0 |
|
Итого по группе |
3 |
8,0 |
|
|
9 |
3,2 |
|
|
10 |
3,4 |
|
Свыше 20 |
11 |
3,8 |
|
|
12 |
3,6 |
|
Итого по группе |
4 |
14,0 |
Вычислите: 1) среднюю внутригрупповую дисперсию; 2) межгрупповую дисперсию; 3) общую дисперсию, используя правило сложения дисперсий; 4) эмпирическое корреляционное отношение.
Задача 5.21
Средняя урожайность зерновых культур в фермерских хозяйствах района составляет 28,4 ц/га. В зависимости от количества внесенных удобрений на 1 га урожайность изменяется следующим образом:
Группы фермерских хо- |
Удельный вес группы в |
Средняя |
Среднее квадратиче- |
зяйств по стоимости удобре- |
посевной площади под |
урожайность, |
ское отклонение |
ний на 1 га зерновых, руб. |
зерновыми, % |
ц/га |
урожайности, ц/га |
До 4 |
25 |
26 |
2 |
|
|
|
|
4−6 |
45 |
28 |
1 |
6 и более |
30 |
31 |
3 |
Определите межгрупповую и общую дисперсии урожайности зерновых культур.
79
Задача 5.22
Средний балл успеваемости студентов очной и заочной форм обучения − 3,7; общая дисперсия − 0,1. На основании следующих данных определите межгрупповую дисперсию и, используя правило сложения дисперсий, среднюю из групповых дисперсий.
Форма обучения |
Число студентов |
Средний балл на экзамене |
|
|
|
Очная |
150 |
4,0 |
|
|
|
Заочная |
50 |
3,6 |
Какую вариацию измеряет средняя из групповых дисперсий?
Задача 5.23
Для изучения зависимости между уровнем заболеваемости и полом ребенка рассчитайте эмпирическое корреляционное отношение и коэффициент детерминации. Сформулируйте выводы.
Пропущено занятий по болезни, дней |
Количество мальчиков |
Количество девочек |
До 5 |
17 |
19 |
|
|
|
5−10 |
29 |
14 |
10−15 |
25 |
20 |
15−20 |
8 |
6 |
20−25 |
9 |
10 |
25 и более |
3 |
4 |
Задача 5.24
Имеются выборочные данные о вкладах населения области:
Группы населения |
Число вкладов, |
Средний размер вклада, |
Коэффициент |
|
тыс. ед. |
тыс. руб. |
вариации вкладов, % |
Городское |
7 |
140 |
20 |
Сельское |
3 |
60 |
30 |
Оцените тесноту связи между средним размером вклада и типом населения, исчислив эмпирическое корреляционное отношение. Сделайте выводы.
Задача 5.25
Для изучения зависимости уровня квалификации в разных бригадах рассчитайте эмпирическое корреляционное отношение и коэффициент детерминации. Сформулируйте выводы.
80