- •Тема 6. Меры вариации
- •6.1. Справочные материалы
- •Меры вариации для сгруппированных данных. Правило сложения дисперсий.
- •Вариация альтернативного (качественного) признака. Правило сложения дисперсий для доли признака.
- •Показатели дифференциации и концентрации
- •6.2. Контрольные вопросы к теме 6
- •6.3. Контрольные задания к теме 6
6.2. Контрольные вопросы к теме 6
Чем вызвана необходимость изучения вариации признака?
Укажите основные показатели вариации.
Какие вам известны способы расчета дисперсии и среднего квадратического отклонения?
Как определяется дисперсия альтернативного признака?
Что такое коэффициент вариации?
Правило сложения дисперсий. Что показывают частная (внутригрупповая), средняя из частных, межгрупповая и общая дисперсии?
Как рассчитываются и что характеризуют коэффициент детерминации и эмпирическое корреляционное отношение?
Как рассчитывают и что характеризуют коэффициент дифференциации и коэффициент фондов?
Показатели концентрации: коэффициенты Джини и Герфиндаля.
6.3. Контрольные задания к теме 6
Дисперсия признака равна 600. Объем совокупности равен 10. Сумма квадратов индивидуальных значений признака равна 6250. Найти среднюю величину.
Средняя величина в совокупности равна 15, среднее квадратическое отклонение равно 10. Чему равен средний квадрат индивидуальных значений этого признака?
Средняя величина в совокупности равна 13, а средний квадрат индивидуальных значений этого признака равен 174. Определить коэффициент вариации.
Дисперсия признака равна 360000, коэффициент вариации равен 50%. Чему равна средняя величина признака?
Дисперсия признака равна 360, средний квадрат индивидуальных значений равен 585. Чему равна средняя?
Определить дисперсию признака, если средняя величина признака равна 2600, а коэффициент вариации признака равен 30%.
Общая дисперсия равна 8,4. Средняя величина признака для всей совокупности равна 13. Средние по группам равны соответственно 10, 15 и 12. Численность единиц в каждой группе составляет 32, 53, и 45. Определить среднюю внутригрупповую дисперсию.
По совокупности, состоящей из 100 единиц, известны: средняя арифметическая – 47,0; сумма квадратов индивидуальных значений признака–231592. Определить, однородна ли изучаемая совокупность.
Определить величину эмпирического корреляционного отношения, если общая дисперсия равна 15,2; групповые средние ;, а численность групп соответственно равны 75, 60 и 65.
Для изучения уровня заработной платы рабочих на предприятии обследовано 500 мужчин и 300 женщин. Результаты исследования показали, что у мужчин средняя заработная плата составила 1200 у.е. при среднеквадратическом отклонении 200 у.е., у женщин соответственно 800 у.е. и 150 у.е.
Определить: 1) среднюю заработную плату работников;
2) дисперсии заработной платы и коэффициент вариации;
3) коэффициент детерминации и эмпирическое корреляционное отношение.
Имеются данные о чистой прибыли (балансовой за вычетом налогов) предприятий двух районов:
Район |
Число предприятий |
Чистая прибыль, млн. руб. |
1 |
6 |
4, 6, 9, 4, 7, 6 |
2 |
10 |
8, 12, 8, 9, 6, 5, 7, 7, 8, 10 |
Определите дисперсии чистой прибыли: групповые (по каждому району), среднюю из групповых, межгрупповую и общую.
Имеются данные о заработной плате по двум группам работников:
Группы работников |
Число работников |
Заработная плата, у.е |
Работающие в 1-й фирме |
4 |
200 |
2 |
300 | |
1 |
400 | |
Работающие в 2-х фирмах |
3 |
500 |
2 |
600 |
Найти все виды дисперсий заработной платы, коэффициент детерминации и эмпирическое корреляционное отношение.
Имеются следующие данные о среднем ежедневном времени занятости семейных женщин в домашнем хозяйстве:
Возрастные группы семейных женщин в домашнем хозяйстве |
Численность женщин в группе |
Частные средние (часов в день) |
Частные дисперсии |
до 25 |
250 |
2,0 |
4,0 |
25-45 |
420 |
3,5 |
6,8 |
свыше 45 |
330 |
3,2 |
5,0 |
Найти общую дисперсию занятости, коэффициент детерминации и эмпирическое корреляционное отношение.
Есть две группы людей с разным месячным доходом (тыс. руб.):
Группа А: 3, 3, 3, 4.
Группа Б: 6, 6, 7.
В какую группу нужно отнести человека с доходом 5 тыс. руб. в месяц.
По результатам маркетингового исследования туристических фирм, организующих недельные туры в Турцию в различные курортные города, получены следующие данные о вариации стоимости туров (цены приведены для гостиниц одного класса):
Месторасположение курорта |
Число туристических фирм |
Средняя цена недельного тура, у.е. |
Дисперсия цен тура в группе |
Анталия |
7 |
530 |
2720 |
Бодрум |
6 |
590 |
8855 |
Итого |
13 |
550 |
5550 |
Найти общую дисперсию, коэффициент детерминации и эмпирическое корреляционное отношение.
По данным выборочного обследования заработной платы работников бюджетной сферы получены следующие показатели:
Отрасль |
Средняя заработная плата, руб. |
Численность работников, чел. |
Дисперсия заработной платы |
здравоохранение |
600 |
80 |
4900 |
образование |
800 |
120 |
16900 |
Определить: 1) среднюю заработную плату работников по двум отраслям;
2) дисперсии заработной платы;
3) коэффициент детерминации и эмпирическое корреляционное отношение.
Имеются следующие данные (условные) по трем группам рабочих:
Стаж работы (лет) |
Число рабочих |
Средняя заработная плата, руб. |
Среднеквадратическое отклонение заработной платы |
до 3 |
10 |
500 |
12 |
3 –10 |
15 |
600 |
10 |
более 10 |
25 |
700 |
20 |
Рассчитать: 1) среднюю заработную плату всей совокупности рабочих;
2) дисперсии заработной платы;
3) коэффициент детерминации и эмпирическое корреляционное отношение.
При изучении бюджета времени студентов было проведено обследование учащихся ВУЗов. При обследовании ВУЗы были разбиты на 7 групп по специализации. Были получены следующие результаты среднего количества времени, затрачиваемого студентами ежедневно на самостоятельную работу:
ВУЗы по группам специальностей |
Число обследованных студентов, тыс.чел. |
Среднее число часов на самостоятельную работу |
Средний квадрат отклонений |
Промышленность и строительство |
42 |
2,0 |
0,6 |
Транспорт |
5 |
1,4 |
0,5 |
Право |
13 |
1,7 |
0,3 |
Экономика |
22 |
1,5 |
0,7 |
Здравоохранение |
10 |
1,0 |
0,8 |
Искусство |
5 |
1,6 |
1,0 |
Просвещение |
36 |
1,8 |
0,.6 |
Используя правило сложения дисперсий определить зависимость между средним числом часов на самостоятельную работу от специализации студента.
Для определения средней величины расходов на полугодовую подписку на газеты и журналы обследуемая совокупность семей разбита на группы по уровня дохода на три группы. По группам получены следующие результаты:
Номер группы |
Число семей в группе |
Средние расходы на подписку, руб. |
Групповые дисперсии |
1 |
300 |
200 |
14 |
2 |
500 |
400 |
30 |
3 |
200 |
600 |
60 |
Определите все виды дисперсий расходов, коэффициент детерминации и эмпирическое корреляционное отношение.
В районе 20 тыс. семей, проживающих в городах, поселках городского типа и сельской местности. В результате были получены следующие данные о среднем числе детей в семьях:
Семьи, проживающие |
Удельный вес семей в генеральной совокупности, % |
Среднее число детей в семьях |
Среднее квадратическое отклонение |
В городах |
50 |
2,3 |
1,2 |
В пос. гор. типа |
10 |
1,8 |
0,5 |
В сельской местности |
40 |
2,8 |
2,5 |
Используя правило сложения дисперсий определите коэффициент детерминации и эмпирическое корреляционное отношение.
Имеются следующие выборочные данные о вкладах населения района:
Группы населения |
Число вкладов |
Средний размер вклада, тыс. руб. |
Коэффициент вариации вклада, % |
Городское |
7 |
4 |
20 |
Сельское |
3 |
6 |
30 |
Определите тесноту связи между средним размером вклада и типом населения, исчислив коэффициент детерминации и эмпирическое корреляционное отношение.
Капитал коммерческих банков характеризуется следующими данными:
№ п/п |
Собственный капитал банков, млн. руб. |
Число банков |
Средний размер привлеченных средств (капитала), млрд. руб. |
Дисперсия привлеченных средств |
1 |
30-40 |
8 |
100 |
400 |
2 |
40-50 |
10 |
180 |
2500 |
3 |
50-60 |
2 |
200 |
3600 |
Определите показатели тесноты связи между размером собственного капитала банков и привлеченными средствами, исчислив коэффициент детерминации и эмпирическое корреляционное отношение.
По данным обследования коммерческих банков города 70% общего числа клиентов составили юридические лица со средним размером кредита 120 тыс. руб. и коэффициентом вариации 25%, а 30% - физические лица со средним размером ссуды 20 тыс. руб. при среднем квадратическом отклонении 6 тыс. руб.
Используя правило сложения дисперсий, определите тесноту связи между размером кредита и типом клиента, исчислив коэффициент детерминации и эмпирическое корреляционное отношение.
Товарооборот по предприятиям общественного питания на одного работника за квартал характеризуется следующими данными:
Предприятие |
Доля предприятий в общей численности работников, % |
Товарооборот в расчете на одного работника, тыс. руб. |
Дисперсия товарооборота в группе |
Столовые |
35 |
13 |
3,29 |
Кафе, закусочные |
50 |
20 |
36,00 |
Рестораны |
15 |
26 |
9,00 |
Определите все виды дисперсий товарооборота предприятий общественного питания, коэффициент детерминации и эмпирическое корреляционное отношение.
Имеются данные о распределении семей сотрудников финансовой корпорации по количеству детей:
Число детей |
Число семей сотрудников по подразделениям | ||
в семье |
первое |
второе |
третье |
0 |
4 |
7 |
5 |
1 |
6 |
10 |
13 |
2 |
3 |
3 |
3 |
3 |
2 |
1 |
- |
Вычислите все виды дисперсий, используя правило сложения дисперсий.
Распределение основных фондов по малым предприятиям отрасли характеризуется следующими данными:
Группы предприятий по стоимости основных фондов, тыс. руб. |
Число предприятий |
Основные фонды в среднем на предприятии, тыс. руб. |
Групповые дисперсии |
12-27 |
18 |
18 |
1,14 |
27-42 |
40 |
32 |
1,09 |
42-57 |
26 |
48 |
1,69 |
57-72 |
12 |
69 |
1,84 |
Рассчитайте коэффициент детерминации и эмпирическое корреляционное отношение. Сделайте выводы.
По переписи населения 1926 года в России доля грамотных среди женщин составляла 46%, а среди мужчин – 77%. Определить общий (средний) процент грамотности всего населения и дисперсию этого показателя, если женщины составляли 53% в общей численности населения.
Определить дисперсию и среднее квадратическое отклонение, если при проверке партии изделий из 1000 шт. 30 шт. оказались бракованными.
Для определения удельного веса женщин в численности работающих в отрасли все предприятия были разбиты по среднесписочному числу работающих на 3 группы:
1-я гр. – с числом работающих до 1000 человек;
2-я гр. - с числом работающих от 1001 до 5000 человек;
3-я гр. - с числом работающих свыше 5000 человек.
Общая численность работающих в 1 группе – 120 тыс.человек, во 2-й группе – 89 тыс., в 3-й группе – 50 тыс. Доля женщин в первой группе оказалась равной 47%, во 2-й – 36%, в 3-й – 29%. С помощью правила сложения дисперсий определите дисперсию удельного веса женщин в отрасли.
Имеются следующие данные о числе домохозяйств, находящихся в условиях крайней бедности (среднедушевые доходы в два раза ниже прожиточного минимума):
Домохозяйство |
Обследовано домохозяйств |
Доля домохозяйств, находящихся в крайней бедности, % |
Без детей |
200 |
6 |
С детьми в возрасте до 16 лет |
500 |
18 |
Пенсионеров |
100 |
25 |
Определите все виды дисперсий, коэффициент детерминации и эмпирическое корреляционное отношение. Сделайте выводы.
Имеются следующие данные о расходах домохозяйств района на товары культурно-бытового назначения:
Домохозяйство |
Обследовано домохозяйств |
Доля расходов на товары культурно-бытового назначения, % |
Имеющие детей |
400 |
9 |
Без детей |
100 |
39 |
Определите все виды дисперсий, коэффициент детерминации и эмпирическое корреляционное отношение.
Имеются следующие данные о расходах на платные услуги домохозяйствами района:
Домохозяйства |
Обследовано домохозяйств |
Доля расходов на платные услуги, % |
городских поселений |
400 |
30 |
сельской местности |
100 |
10 |
Определите все виды дисперсий, коэффициент детерминации и эмпирическое корреляционное отношение.
Имеются следующие выборочные данные о расходах на питание домохозяйствами города:
|
Численность домохозяйств в выборке |
Доля расходов на питание |
Одинокие |
30 |
42 |
Семейные |
70 |
53 |
Определите все виды дисперсий, коэффициент детерминации и эмпирическое корреляционное отношение.
Имеются данные о совокупной выручке (млрд. руб.) за 1997г. 50 крупнейших аудиторско-консультационных фирм
1 |
- |
78,1 |
11 |
- |
17,5 |
21 |
- |
7,2 |
31 |
- |
4,0 |
41 |
- |
2,7 |
2 |
- |
44,8 |
12 |
- |
15,8 |
22 |
- |
7,0 |
32 |
- |
3,8 |
42 |
- |
2,7 |
3 |
- |
35,2 |
13 |
- |
15,7 |
23 |
- |
6,8 |
33 |
- |
3,6 |
43 |
- |
2,7 |
4 |
- |
34,6 |
14 |
- |
14,5 |
24 |
- |
6,6 |
34 |
- |
3,6 |
44 |
- |
2,7 |
5 |
- |
32,5 |
15 |
- |
13,2 |
25 |
- |
5,6 |
35 |
- |
3,5 |
45 |
- |
2,6 |
6 |
- |
31,8 |
16 |
- |
12,0 |
26 |
- |
5,1 |
36 |
- |
3,1 |
46 |
- |
2,6 |
7 |
- |
25,4 |
17 |
- |
11,6 |
27 |
- |
4,8 |
37 |
- |
3,0 |
47 |
- |
2,2 |
8 |
- |
23,0 |
18 |
- |
9,4 |
28 |
- |
4,5 |
38 |
- |
3,0 |
48 |
- |
2,1 |
9 |
- |
17,8 |
19 |
- |
7,6 |
29 |
- |
4,5 |
39 |
- |
3,0 |
49 |
- |
1,5 |
10 |
- |
17,7 |
20 |
- |
7,3 |
30 |
- |
4,4 |
40 |
- |
2,9 |
50 |
- |
1,5 |
1) Постройте вариационный ряд, образовав 7-8 интервалов произвольно.
2) Рассчитайте средний размер размер выручки на одну фирму на основе средней арифметической, моды медианы.
3) Рассчитайте показатели вариации.
4) Измерьте дифференциацию выручки на основе децильного коэффициента и коэффициента фондов.
5) Рассчитайте коэффициент концентрации Джини и Герфиндаля.
Имеются данные о распределении населения РФ по размеру среднедушевого денежного дохода в первом полугодии 2000 года:
Среднедушевой денежный доход, ден. ед. |
Численность населения в % от общей численности |
до 400 |
2,7 |
400,1-600,0 |
6,6 |
600,1-800,0 |
9,3 |
800,1-1000,0 |
10,1 |
1000,1-1200,0 |
9,9 |
1200,1-1600,0 |
16,9 |
1600,1-2000,0 |
12,6 |
свыше 2000,0 |
31,9 |
ВСЕГО: |
100 |
Рассчитайте: 1) среднедушевой денежный доход на основе средней арифметической, моды и медианы;
2) показатели дифференциации концентрации;
1 Использование коэффициента вариации имеет смысл при изучении вариации признака, принимающего только положительные значения. Совершенно неправильно пользоваться V в случае измерения колеблемости признака, принимающего как положительные, так и отрицательные значения. Не имеет смысла, например, V, вычисленный для изучения колеблемости среднегодовой температуры воздуха, что особенно ясно при среднегодовой температуре близкой к нулю.
2 Существует много других аналитических выражений коэффициента Джини, но в целях экономии места мы остановимся на одном.