- •Оглавление
- •Введение
- •1.Генеральная совокупность и выборка из генеральной совокупности
- •2. Выборка, ее представление и числовые характеристики
- •2.1. Представление выборки
- •2.1.1. Таблица частот и интервальная
- •2.1.2. Графическое представление выборки.
- •2.2. Числовые характеристики выборки
- •2.2.1. Выборочное среднее, мода, медиана
- •2.2.2. Квартили, декатили, персентили
- •2.2.4. О симметричных и несимметричных распределениях
- •2.2.5. Вычисление выборочного среднего и выборочной дисперсии для объединения двух выборок
- •1. , Тогда .
- •2.2.6. Общая, межгрупповая и внутригрупповая дисперсии
- •2.2.7. Кривая Лоренца и показатели концентрации
- •2.3. Задачи
- •3. Обработка результатов наблюдений по методу наименьших квадратов
- •3.1. Двумерные выборки
- •3.2. Графическое представление двумерных выборок — диаграммы рассеяния
- •3.3. Выборочный коэффициент корреляции — числовая характеристика двумерной выборки
- •3.4. Метод наименьших квадратов
- •3.5.6. Пример построения нелинейного уравнения регрессии
- •3.6. Расчет коэффициентов линейного уравнения регрессии по сгруппированным данным
- •3.7. Индекс корреляции
- •3.8. Индекс фехнера и корреляционнное отношение
- •3.9.Задачи
- •6. Проверка гипотезы о законе распределения генеральной совокупности по критерию пирсона (критерию 2)
- •6.1. Пример
- •6.2. Немного теории
- •1.3. Другие примеры
- •6.3.1. Проверка гипотезы о нормальном законе распределения
- •200 Отклонений диаметра вала от номинального размера (мкм)
- •6.3.2. Проверка гипотезы о равномерном законе распределения
- •6.3.3. Проверка гипотезы о биномиальном законе распределения
- •6.3.4. Проверка гипотезы о законе распределения Пуассона
- •6.3.5. Последний пример
- •6.4. Задачи
- •10. Результаты испытаний прочности партии стальной проволоки диаметром 1,4 мм:
2.2.6. Общая, межгрупповая и внутригрупповая дисперсии
Пусть из k выборок объемов n1, n2, …, nk соответственно образована одна выборка объема n = n1 + n2 +…+ nk. Обозначим через , 1, …, k, S2, S12, …, Sk2 выборочные средние и выборочные дисперсии объединенной выборки и исходных выборок соответственно. Обобщая формулы, рассмотренные выше, получим, что объединенная дисперсия равна
.
Величину S называют еще общей дисперсией. Величины S12, S22, …, Sk2 называют внутригрупповыми дисперсиями.
Величина называется межгрупповой дисперсией. Она показывает, насколько в среднем выборочные средние отдельных выборок отличаются от общего выборочного среднего. Тем самым оценивается, насколько внутригрупповые выборочные средние отличаются друг от друга. Мы разложили общую дисперсию на сумму межгрупповой дисперсии и среднего из внутригрупповых дисперсий.
2.2.7. Кривая Лоренца и показатели концентрации
С помощью кривой Лоренца представляют распределение некоторых ресурсов (капитала, земли, рабочей силы и т.п.) среди владельцев ресурсов. Если значительная часть ресурсов сосредоточена у небольшой доли владельцев, говорят о высокой степени концентрации ресурсов.
Степень концентрации оценивают с помощью специальных коэффициентов. Неравномерность распределения ресурсов можно проследить и по кривой Лоренца, при построении этой кривой по горизонтальной оси откладывают накопленные доли владельцев ресурсов, а по вертикальной оси – относительные накопленные частоты объема ресурсов. Полученные точки соединяют отрезками.
Рассмотрим распределение в 1964 г. ферм в США, сгруппированных по величине занимаемых площадей (табл. 2.5).
Таблица 2.5
Площадь фермы, акр (1акр0,4га) |
Число ферм, тыс.
|
Общая площадь занимаемой земли, тыс. акров |
Относительные частоты |
Относительные накопленные частоты, % |
||
Число ферм |
Площадь земли |
Число ферм |
Площадь земли |
|||
[0 - 10) |
183 |
778 |
0,057 |
0,0007 |
5,7 |
0,07 |
[10 - 50) |
637 |
17325 |
0,202 |
0,0156 |
25,9 |
1,63 |
[50 - 100 ) |
542 |
39589 |
0,172 |
0,0357 |
43,1 |
5,2 |
[100 - 180 ) |
633 |
86592 |
0,201 |
0,0780 |
63,2 |
13,0 |
[180 - 260 ) |
355 |
76857 |
0,112 |
0,0692 |
74,4 |
19,92 |
[260 - 500) |
451 |
159598 |
0,143 |
0,1438 |
88,7 |
34,3 |
[ 500 - 1000 ) |
210 |
144600 |
0,067 |
0,1302 |
95,4 |
47,32 |
1000 |
145 |
584848 |
0,046 |
0,5268 |
100,0 |
100,0 |
ВСЕГО |
3156 |
1110187 |
1,00 |
1,00 |
– |
– |
Здесь ресурсы – это земля; владельцы ресурсов – фермы. Кривая Лоренца построена на рис. 2.7.
Если бы распределение земли было строго равномерным, то 5,7% ферм располагали бы 5,7% земли; 25,9% ферм располагали бы 25,7% земли и т.д., а кривая Лоренца стала бы биссектрисой координатного угла. Эта биссектриса называется линией равномерного распределения.
Чем сильнее кривая Лоренца отклоняется от линии равномерного распределения, тем выше концентрация ресурсов. В нашем случае 52,7% всей земли сконцентрировано у 4,6% крупных ферм. А на остальные 95,4% небольших ферм приходится менее половины угодий.
Степень концентрации можно оценить, вычисляя площадь фигуры А (см. рис.2.7), ограниченной линией равномерного распределения и кривой Лоренца. Если принять площадь квадрата за 1, то удвоенная площадь фигуры А равна разности 1 минус удвоенная площадь фигуры В.
Последняя легко считается как сумма площадей трапеций, составляющих фигуру В. Таким образом определяется коэффициент Джини:
Линия равномерного
распределения
A
B
Рис. 2.7
,
где k – число интервалов группировки;
xi – относительная частота i-го интервала группировки владельцев ресурсов;
yi – относительная частота i-го интервала группировки ресурсов;
yiнак – относительная накопленная частота i-го интервала группировки ресурсов.
На рис.2.8 показана i-я трапеция, составляющая фигуру B, и приведен расчет площади этой трапеции.
С
Si
Рис. 2.8
Тогда
В нашем случае
G = 1 - 2(0,057*0,0007 + 0,202*0,0163 + 0,172*0,052 + 0,201*0,13 + +0,112*0,1992 + 0,143*0,343 + 0,067*0,4732 + 0,046*1) + (0,057*0,0007 + +0,202*0,0156 + 0,172*0,0357 + 0,201*0,078 + 0,112*0,0692 + 0,143* *0,1438 + 0,067*0,1302 + 0,046*0,5268) = 0,7113 (71,13%).
Другой коэффициент, оценивающий степень концентрации, называется коэффициентом Лоренца. Рассмотрим сумму
,
По известному свойству модуля
.
Число 2 получается в пределе, если практически 100% ресурсов сосредоточены у бесконечно малой доли владельцев. Поэтому, чем ближе к 2 эта сумма, тем выше концентрация ресурсов, тем неравномернее они распределены.
Коэффициент Лоренца определяется так:
.
Для нашего случая получаем:
L = (1/2)*(0,057 - 0,0007 + 0,202 - 0,0156 + 10,172 - 0,0357+ +0,201 - 0,0780 + 0,112 - 0,0692 + 0,143 - 0,1438 + 0,067 - 0,1302 + +0,046 - 0,5268)*100% = 54,5%.
Полученные значения коэффициентов Джини и Лоренца говорят о высокой степени концентрации земли на крупных фермах.