Скачиваний:
30
Добавлен:
08.04.2015
Размер:
764.42 Кб
Скачать

4.3. Методологические и практические аспекты построения однофакторных регрессионных моделей

Методологические и практические аспекты построения однофакторных регрессионных моделей рассмотрим на примере анализа показателей здоровья населения ряда европейских стран. Цель данного исследования – сопоставление уровня здоровья российского населения с уровнем здоровья населения развитых стран.

В Докладе Программы развития ООН (ПРООН) о развитии человека 2010 года подчеркивается, что одним из индикаторов уровня здоровья, как важнейшей составляющей интегрального индикатора уровня жизни, является ожидаемая продолжительность жизни при рождении. Отмечается также, что самыми здоровыми обществами в мире являются не самые богатые страны, а те, в которых доход распределяется наиболее равномерно и достигнут более высокий уровень социальной интеграции. Так, уровень здоровья жителей Японии и Швеции, которые считаются одними из самых эгалитарных обществ в мире, выше, чем у жителей стран, в которых разрыв между богатыми и бедными больше, например, в США [45].

В зарубежной и отечественной статистике принято характер распределения доходов оценивать по коэффициенту фондов (коэффициенту дифференциации доходов) и коэффициенту Джини (индексу концентрации доходов). Первый из этих коэффициентов характеризует степень социального расслоения и определяется как соотношение между средними уровнями денежных доходов 10% населения с самыми высокими доходами и 10% населения с самыми низкими доходами, второй – характеризует степень отклонения фактического распределения общего объема доходов от равномерного распределения. Величина коэффициента Джини может варьироваться от 0 до 1, и чем выше значение показателя, тем неравномернее распределены доходы.

В статистических изданиях типа [176-186] вышеназванные показатели, как правило, приводятся в региональном и временном разрезах. В то же время, часто приходится их рассчитывать по первичным данным – распределению общего объема денежных доходов по группам населения, выражаемого через долю общего объема денежных доходов 20-процентных групп населения, ранжированного по возрастанию среднедушевых денежных доходов.

Что касается индикаторов уровня здоровья населения, то наряду с ожидаемой продолжительности жизни при рождении всего населения в целом, а также мужского и женского в отдельности, часто используют коэффициенты общей смертности – количество смертей на 1000 населения.

Данное исследование преследует две цели: во-первых, установить, какие из показателей здоровья являются наиболее информативными на страновом и региональном уровнях, во-вторых, предложить методику расчета показателей дифференциации доходов населения по первичным данным. Последнее вызвано тем, что в разных статистических источниках указываются показатели, рассчитанные по различным методикам [198].

Эмпирической базой исследования послужили статистические источники [176-186, 195], инструментом исследования – пакет анализа данных общественных наук SPSS Base.

Рассмотрим вначале страновый уровень. В источнике [195] приведены данные по продолжительности жизни населения (далее ПЖ) ряда стран мира, среди которых 26 европейских стран, 14 – азиатских, три страны – африканские, пять стран расположены в Америке и еще две – это Австралия и Новая Зеландия. Поскольку страны разных континентов имеют свои особенности, ограничимся анализом индикаторов уровня здоровья населения европейских стран.

На рис. 4.1 представлены диаграммы Парето, иллюстрирующие ранжирование некоторых европейских стран по продолжительности жизни населения при рождении; для удобства страны разделены на две группы по величине этого индикатора уровня здоровья: группа 1 – ПЖ 75 лет и более; группа 2 – ПЖ до 75 лет.

а

б

Рис. 4.1. Ранжирование европейских стран по продолжительности жизни при рождении (2009-2010 гг.)

Как видно из диаграмм на рис. 4.1, в первую группу стран – с продолжительностью жизни населения при рождении 75 лет и более, – входят преимущественно страны Западной Европы, исключением являются Словакия, Словения, Чешская Республика, Польша и Эстония. Во вторую группу – с продолжительностью жизни населения меньше 75 лет – входят страны Восточной Европы и Балтии, при этом Россия замыкает ранжированный ряд стран.

Между продолжительностью жизни женского и мужского населения европейских стран в целом наблюдается сильная корреляция – рис. 4.2 а.

Из рис. 4.2 а следует также, что продолжительность жизни мужского населения европейских стран меньше, чем женского, на величину от 4-х до 12-ти лет. Можно предположить, что между этой разностью и продолжительностью жизни населения стран в целом существует отрицательная корреляционная связь. Расчеты показывают, что коэффициент линейной корреляции между этими двумя показателями продолжительности жизни составляет значение R=-0,869, статистически значимое на уровне не хуже 0,0005 – рис. 2 б.

а

б

Рис. 4.2. Корреляция показателей продолжительности жизни при рождении в европейских странах в 2009-2010 гг.: а – ПЖ мужчин и женщин; б – разности ПЖ женщин и мужчин с ПЖ всего населения

Между продолжительностью жизни женского и мужского населения европейских стран наблюдается сильная корреляция (линейный коэффициент корреляции R=0,954), и можно рассчитать МНК-оценки регрессионной связи. Для определенности, примем в качестве предиктора продолжительность жизни мужского населения, а в качестве результативной переменной продолжительность жизни женского населения. Воспользовавшись процедурой «Linear Regression» пакета SPSS Base, получаем следующую модель:

ПЖ(жен) = 38,67 + 0,57 ПЖ(муж). (4.52)

Содержательный смысл в данной модели имеет коэффициент регрессии 0,57: увеличению продолжительности жизни мужчин на один год отвечает, в среднем, увеличение продолжительности жизни женщин на 0,57 лет.

Приведем характеристики качества модели (4.52): коэффициент детерминации R2=0,91, т.е. модель объясняет 91% общей дисперсии; критерий Фишера F=242,71 статистически значим на уровне не хуже 0,0005; стандартная ошибка аппроксимации StErr=1,03 лет. Это – хорошие характеристики. (Заметим, что коэффициент детерминации в случае простой линейной регрессии равен квадрату коэффициента корреляции.)

Адекватность модели (4.52) проверяем путем анализа остатков – рис. 4.3.

а

б

Рис. 4.3. Связь расчетных значений ПЖ женского населения: а – с фактическими значениями ПЖ женского населения; б – с остатками

На диаграмме рис. 4.3 а приведен график, отражающий связь между фактическими и расчетными значениями продолжительности жизни женского населения ряда европейских стран, а на диаграмме рис. 4.3 б – график зависимости остатков от расчетных значений продолжительности жизни женского населения. Видно, что в целом поведение остатков не противоречит гипотезе адекватности линейной модели.

График остатков на рис. 4.3 б можно также использовать для содержательного анализа дифференциации стран по изучаемому показателю. Здесь «работают» 90%-е доверительные границы, нанесенные на диаграммы рассеяния: на рис. 4.3 а – для индивидуальных значений, на рис. 4.3 б – для средних значений показателя. Во первых, видно, что за пределы границ 90%-го доверительного интервала для индивидуальных значений «вышло» фактическое значение продолжительности жизни женского населения лишь одной страны – Республики Молдова. Это – «выброс», исключение из общей тенденции: судя по диаграмме рис. 4.3 б, продолжительность жизни женского населения Республики Молдова на три года меньше расчетного значения. Во-вторых, доверительные границы на диаграмме рис. 4.3 б делят страны на три группы: 1) страны центральной тенденции, к которым относятся и Россия; 2) страны, в которых фактическая продолжительности жизни женщин больше расчетных значений, например, Эстония, Литва, Франция; 3) страны, в которых фактическая продолжительности жизни женщин меньше расчетных значений, например, Болгария, Румыния.

Мы не задаемся здесь целью дать объяснение наблюдаемым различиям, однако ясно, что эти различия могут дать толчок для выдвижения различных гипотез с их последующей проверкой.

Рассмотрим еще один индикатор уровня здоровья населения – коэффициент общей смертности – рис. 4.4.

а

б

Рис. 4.4. Ранжирование европейских стран по значению коэффициента общей смертности в 2008-2010 гг.

Из диаграмм Парето на этом рисунке следует, что в группе 1 европейских стран только две страны характеризуются средними значениями коэффициента общей смертности в 2008-2010 гг., больше медианного (10,2 промилле). В группе 2 все страны характеризуются средними значениями коэффициента общей смертности в 2008-2010 гг. выше медианного, т.е. в целом наблюдается отрицательная кореляция между общей смертностью и продолжительностью жизни при рождении. На диаграмме рис. 4.3 б можно также заметить, что в России в период 2008-2010 гг. общая смертность снижалась.

Согласно теории статистики, наиболее информативны те показатели, которые в наибольшей степени варьируют по выборке, в данном случае, по 26 европейским странам. В табл. 4.2 приведены статистические характеристики всех пяти показателей уровня здоровья населения европейских стран рассматриваемой выборки.

Таблица 4.2

Статистические характеристики показателей уровня здоровья населения по выборке европейских стран

Показатель уровня здоровья населения

Среднее

Стандартное отклонение

Коэф. вариации, %

Продолжительность жизни всего населения, лет

76,535

4,466

5,84

Продолжительность жизни мужчин, лет

72,841

5,638

7,74

Продолжительность жизни женщин, лет

80,210

3,371

4,20

Разность ПЖ женщин и мужчин, лет

7,369

2,625

35,63

Коэффициент общей смертности, промилле

11,115

2,221

19,99

Из последней графы табл. 4.2 следует, что в наибольшей степени по рассматриваемой выборке европейских стран варьирует разность продолжительности жизни женского и мужского населения – коэффициент вариации этого показателя составляет 35,63%, т.е. он наиболее информативен. На втором месте по информативности – коэффициент общей смертности, для него коэффициент вариации равен 19,99%. Меньше всего варьирует по выборке европейских стран продолжительность жизни женского населения: коэффициент вариации этого показателя 4,2%, тогда как для мужского населения он равен 7,74%.

Поскольку данные отдельно по женскому и мужскому населению приводятся не во всех статистических источниках, приходим к выводу, что в большей мере отвечает требованиям, предъявляемым к индикаторам, коэффициент общей смертности населения. Этот показатель хорошо коррелирует и с продолжительностью жизни всего населения, и с разностью продолжительности жизни женского и мужского населения (коэффициент линейной корреляции равен R=-0,890 и 0,789 соответственно) – рис. 4.5.

Еще одним доводом в пользу коэффициента общей смертности населения, как индикатора уровня здоровья нации, является то, что данный коэффициент наблюдается непосредственно, тогда как остальные показатели – расчетного характера.

Перейдем к региональному уровню. Учитывая требование к однородности выборки, в качестве объекта исследования рассмотрим регионы ЦФО. В них проживает преимущественно русское население, и можно ожидать, что показатели уровня здоровья населения в них примерно одинаковы. В качестве эмпирической базы использовали данные 2009 г., приведенные в источнике [184].

а

б

Рис. 4.5. Связь средних значений коэффициента общей смертности в 2008-2010 гг. по выборке европейских стран с показателями уровня здоровья населения: а – продолжительностью жизни при рождении; б – разностью ПЖ женского и мужского населения

Диаграмма Парето, иллюстрирующая ранжирование регионов ЦФО по продолжительности жизни населения при рождении, представлена на рис. 4.6 а, а на рис. 4.6 б приведены территориальные профили по этому показателю, а также по ПЖ мужского и женского населения.

а

б

Рис. 4.6. Ранжирование регионов по продолжительности жизни при рождении 2009 гг. Пунктир – уровень РФ

Как видно из диаграмм рис. 4.6, продолжительность жизни населения г. Москвы заметно больше, чем в остальных регионах Центральной России. На втором месте по данному показателю – Белгородская область, на третьем – воронежская. Эти три региона характеризуются уровнем показателя, превышающим среднее по РФ значение 68,67 лет. Последнее место занимает Тверская область с показателем 65,3 года.

На рис. 4.6 б обращает на себя внимание, что по мере снижения продолжительности жизни населения регионов в целом, увеличивается и разность между продолжительностью жизни женщин и мужчин. Таким образом, на региональном уровне также наблюдается отрицательная корреляционная связь между этими двумя показателями здоровья населения.

Рассмотрим еще один региональный показатель уровня здоровья населения – коэффициент общей смертности – рис. 4.7 а.

Видно, что и по этому показателю г. Москва характеризуется более высоким значением, чем в среднем в РФ: если в РФ в целом на 1000 населения в 2009 г. наблюдалось 14,2 смертей, то в Москве – 11,4. Во всех остальных регионах, включая Белгородскую область, смертность в 2009 г. была выше, чем в РФ.

а

б

Рис. 4.7. Ранжирование регионов ЦФО по значению коэффициента общей смертности в 2009 г. (а) и отрицательная корреляционная связь между продолжительностью жизни и коэффициентом общей смертности (б)

Пунктир – уровень РФ

Как и на страновом уровне, для регионов ЦФО также наблюдается отрицательная корреляция между коэффициентом общей смертности и продолжительностью жизни при рождении – рис. 4.6 б. Коэффициент линейной корреляции, рассчитанный по полной выборке регионов, составляет R=-0,953, что характеризует данную связь как очень сильную.

Таким образом, все пять показателей уровня здоровья населения являются «претендентами» на региональный индикатор этой важнейшей составляющей интегрального показателя уровня жизни населения в регионах Центральной России. Выбор между ними определяется так же, как в случае стран, их информативностью, отражаемой величиной коэффициента вариации по выборке регионов ЦФО.

В табл. 4.3 приведены статистические характеристики региональных показателей уровня здоровья населения Центральной России – среднее невзвешенное, стандартное отклонение (среднее квадратическое отклонение), коэффициент вариации. Как следует из последней графы табл. 4.3, в наибольшей степени по регионам ЦФО варьирует коэффициент общей смертности, для которого коэффициент вариации равен 11,46%. Меньше всего варьирует по выборке регионов ЦФО продолжительность жизни женского населения: коэффициент вариации этого показателя 1,81%, тогда как для мужского населения он равен 4,02%.

Таблица 4.3

Статистические характеристики показателей уровня здоровья населения регионов ЦФО

Показатель уровня здоровья населения

Среднее

Стандартное отклонение

Коэф. вариации, %

Продолжительность жизни всего населения, лет

68,0639

1,94249

2,85

Продолжительность жизни мужчин, лет

61,7233

2,49437

4,04

Продолжительность жизни женщин, лет

74,6467

1,35046

1,81

Разность ПЖ женщин и мужчин, лет

12,9233

1,37374

10,63

Коэффициент общей смертности, промилле

17,0833

1,95726

11,46

С учетом полученных результатов, требованиям, предъявляемым к индикаторам, в наибольшей мере отвечает коэффициент общей смертности населения.

Перейдем к анализу показателей, отражающих неравномерность распределения доходов. На страновом уровне в источнике [195], наряду с коэффициентами Джини и фондов, приведены также распределения общего объема денежных доходов по 20-процентным группам населения, что позволяет сопоставить значения этих коэффициентов с результатами их расчета по первичным данным.

Методику подобного расчета рассмотрим на примере двух стран – России и Германии, распределения общего объема денежных доходов по 20-процентным группам населения для которых представлены в табл. 4.4. Из таблицы видно, что распределение общего объема денежных доходов по 20-процентным группам германского населения равномернее российского (временные различия здесь не столь существенны): в Германии доли доходов варьируют от 8,5% до 36,9%, а в России – от 5,2% до 47,3%. Отсюда следует, что значение коэффициента фондов для германского населения меньше, чем российского.

Таблица 4.4

Распределения общего объема денежных доходов по 20-процентным группам населения России и Германии

Страна

Год

Доля доходов (потребительских расходов), приходящаяся на каждую из 20-процентных групп населения

Коэффи-циент Джини

Коэффи-циент фондов (в разах)

первая

вторая

третья

четвертая

пятая

Россия

2006

5,2

9,9

15,0

22,6

47,3

41,6

16,0

Германия

2000

8,5

13,7

17,8

23,1

36,9

28,3

6,9

Можно оценить значения этого показателя при допущении, что кривая Лоренца (т.е. кривая зависимости накопленной доли общего объема денежных доходов от накопленной доли населения) аппроксимируется отрезками прямых, соединяющих соответствующие точки на диаграмме Лоренца – так, как это показано на рис. 4.8 а.

Оговорка «оценить» вызвана тем, что обычно коэффициент фондов определяется как соотношение между средними уровнями денежных доходов 10% населения с самыми высокими доходами и 10% населения с самыми низкими доходами, мы же располагаем данными по 20-процентным группам населения.

С учетом сказанного, оценка коэффициента фондов Кф составит:

для России Кф = 47,3% / 5,2% = 9,1 раз;

для Германии Кф = 36,9% / 8,5% = 4,3 раз.

Эти оценки существенно отличаются от приведенных в последней графе табл. 4.4 значений 16,0 и 6,9 соответственно, но соотношения тех и других примерно совпадает. В качестве недостатка коэффициента фондов, рассматриваемого как индикатор дифференциации доходов, отметим, что он рассчитывается лишь по двум точкам кривой Лоренца, при этом остальная информация не используется. В то же время, при расчете коэффициента Джини (или индекса концентрации доходов) используется вся информация, содержащаяся в кривой Лоренца. А именно: коэффициент Джини характеризует степень отклонения кривой фактического распределения общего объема доходов от прямой равномерного распределения – пунктирной прямой, соединяющей на рис. 4.8 а точки с координатами (0; 0) и (100; 100).

а

б

Рис. 4.8. Построение кривой Лоренца распределения общего объема денежных доходов по 20-процентным группам для России (а) и сравнение кривых Лоренца для российского и германского населения (б)

Выполненные нами расчеты показывают, что значения коэффициента Джини для населения России и Германии составляют G=0,388 и 0,265 соответственно. Это меньше, чем 0,416 и 0,283 (данные в табл. 3 выражены в процентах), что объясняется приближенностью расчета по 20-процентным группам германского населения. Тем не менее, соотношения значений коэффициента Джини для населения России и Германии сохраняются: 0,388/0,265=1,4641,6/28,3=1,47. Это означает, что степень отклонения соответствующих кривых фактического распределения общего объема доходов, от прямой равномерного распределения, для России больше, чем для Германии, почти в полтора раза (рис. 4.7 а).

На рис. 4.9 выполненные нами расчеты значений индекса Джини и коэффициента фондов сопоставлены с данными источника [198].

а

б

Рис. 4.9. Построение кривой Лоренца распределения общего объема денежных доходов по 20-процентным группам для России (а) и сравнение кривых Лоренца для российского и германского населения (б)

Как видно из рис. 4.9, между фактическими и расчетными значениями показателей дифференциации доходов на страновом уровне наблюдается сильная линейная корреляция (коэффициенты корреляции 0,985 для индекса Джини и и 0,986 для коэффициента фондов), что позволяет рассчитать параметры соответствующих линейных регрессий:

G(%) = -0,742 + 109,427 Gрасч; (4.53)

Кф = -1,707 + 1,943 Кф_расч. (4.54)

Ввиду статистической незначимости свободного коэффициента b0=-0,742 в уравнении (4.53) можно перейти к более простой пропорциональной модели:

G(%) = 106,961 Gрасч. (4.55)

Из (4.55) следует, что расчет индекса Джини по 20-процентным группам населения занижает его значения примерно на 7%.

На региональном уровне приведенные выше закономерности сохраняются. Покажем это на примере однородной выборки, включающей все регионы ЦФО, кроме г. Москвы.

Сопоставление расчетных и фактических значений коэффициента фондов, с одной стороны, и индекса Джини, с другой, представлено на рис. 4.10.

Из диаграмм рис. 4.10 следует, что между расчетными и фактическими значениями показателей дифференциации доходов населения регионов ЦФО имеется сильная корреляционная связь – значения коэффициента линейной корреляции для индекса Джини и коэффициента фондов составляют 1,000 и 0,999 соответственно, т.е. между расчетными и фактическими значениями показателей наблюдается практически функциональная связь. Между собой значения индекса Джини и коэффициента фондов также сильно коррелируют – с коэффициентом линейной корреляции 0,997.

а

б

Рис. 4.10. Построение кривой Лоренца распределения общего объема денежных доходов по 20-процентным группам для России (а) и сравнение кривых Лоренца для российского и германского населения (б)

Расчеты параметров линейных регрессий дают следующие результаты:

G = -0,011 + 1,103 Gрасч; (4.56)

Кф = -2,808 + 2,074 Кф_расч. (4.57)

И здесь, ввиду статистической незначимости свободного коэффициента b0=-0,011 в уравнении (4.53), следует перейти к более простой пропорциональной модели:

G = 1,072 Gрасч. (4.58)

Из (4.57) следует, что расчет индекса Джини по 20-процентным группам населения, и в случае регионов его значения также занижаются примерно на 7%.

Полученные выше соотношения (4.52)-(4.58), ввиду их высокой точности, рекомендуются к практическому использованию при проведении сравнительных страновых и региональных исследований.

В данном разделе затронуты лишь некоторые аспекты измерения частных индикаторов уровня жизни населения территориальных образований, вопросы формирования интегрального показателя будут рассмотрены нами позднее.

108

Соседние файлы в папке моно_2012_Шуметов_Крюкова