Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Инновац. соц. технол. Прогнозир. инвалидизации....doc
Скачиваний:
5
Добавлен:
03.11.2018
Размер:
882.69 Кб
Скачать
  •  Влияние характера распределения на результаты расчетов весьма велико. В социально-экономических исследованиях преобладают ряды, имеющие правую скошенность (резкий спад частот с ростом значений признака). При работе с такими распределениями часто переходят к логарифмической шкале. Переход от xj к уменьшает интервалы по мере роста значений xj. В результате становится возможным исследование сильно различающихся по масштабу данных в одной задаче.

  •  Как правило, признаки, отобранные исследователем для всестороннего описания того или иного явления, имеют различную размерность, а потому и различные единицы масштаба. Чтобы устранить влияние размерности и сопоставлять признаки, матрицу исходных данных обычно нормируют, вводя единый для всех признаков масштаб.

  •  Для учета качественной априорной информации об исследуемых данных, непосредственно в исходной матрице не содержащейся, используют специальные преобразования. К таким преобразованиям относятся различные способы пополнения исходной матрицы данных производными параметрами. Часто в качестве новых параметров фигурируют отношения некоторых из исходных параметров или отношения сумм одних из исходных параметров к суммам других.

    Анализ структуры причинно-следственных связей (7) является важным этапом экономико-статистического моделирования. Даже в случае неполной информации о логике поведения моделируемого процесса практически всегда могут быть высказаны некоторые профессиональные соображения о характере и направлении связей. Необходимость поиска методов априорного анализа связей в первую очередь вызвана тем, что связи признаков, описывающих процесс функционирования реального объекта, всегда имеют определенную структуру и ориентацию. Одним из способов решения данной проблемы является использование аппарата теории графов (8).

    Известно, что первоначальный набор переменных весьма избыточен. В него включаются все известные переменные, которые с содержательной точки зрения могут оказаться значимыми. В окончательном варианте исследователь ограничивается конечным и, как правило, небольшим числом переменных. За пределами его внимания по разным причинам остается большое число переменных, связанных друг с другом отношениями влияния. Таким образом, реально исследователь всегда рассматривает часть (или несколько частей) некоторой схемы влияния. Преобразуя графы, можно уменьшить размерность набора переменных, не искажая структуры причинно-следственных связей оставшихся переменных. Другими словами, используя операции над графом, можно выделить необходимую часть структуры таким образом, чтобы связи, опосредованные исключаемыми характеристиками новой структуры, сохранились.

    Преобразование пространства признаков состоит в отборе существенных факторов. В процессе моделирования приходится разрешать противоречие между многомерностью экономических явлений, связанных между собой, и стремлением упростить модель с целью выделения наиболее существенных связей. В модель должны быть включены все факторы, которые с содержательных позиций оказывают влияние на зависимую переменную. Но в то же время их количество не должно быть слишком большим. Таким образом, исходное пространство признаков должно подвергаться предварительному анализу и преобразованию с целью уменьшения числа переменных, включаемых в модель. Необходимость и целесообразность такого преобразования объясняется тем, что анализ взаимосвязи признаков и их группировка дают дополнительную содержательную информацию, позволяют выявить определенные закономерности в описании объекта, более обоснованно подойти к формированию модели и оценке ее оптимального размера.

    Принципиальная и практическая необходимость снижения размерности признакового пространства обусловлена рядом обстоятельств. Во-первых, возникает необходимость устранения явления мультиколлинеарности. Во-вторых, необходимо учитывать максимально возможное для данных условий число переменных модели. "Конечное" число переменных должно быть в несколько раз меньше числа единиц наблюдения. Наконец, необходимость снижения размерности признакового пространства обусловливается соображениями удобства построения и последующей интерпретации модели.

    Конечная цель решения задачи минимизации описания более глубока, чем простое представление большого массива исходных данных: коль скоро удалось коротко представить обширную информацию, то появляется уверенность, что вскрыта некоторая объективная закономерность, существующая в структуре признакового пространства и позволяющая провести это сокращение.

    Методические подходы к выбору существенных признаков зависят от того, на какой стадии моделирования они осуществляются. Процесс выбора существенных признаков не заканчивается на стадии предварительного анализа информации, а продолжается в процессе построения экономико-статистической модели. Однако идеи, лежащие в основе выбора существенных признаков на этих двух стадиях экономико-статистического исследования, различны.

    На этапе предварительного анализа сужение набора переменных производится исходя из внутренних свойств пространства признаков и учета их взаимосвязи. При этом отбор и упорядочение признаков основаны на оценке их относительной важности для характеристики единицы совокупности независимо от специфической цели исследования и типа используемого в дальнейшем математического аппарата моделирования.

    Критерий выбора информативной подсистемы признаков в ходе построения модели учитывает конкретную цель исследования и специфику используемых методов моделирования. Этот критерий помимо учета взаимосвязи переменных основан на оценке важности отдельных признаков для аппроксимации и прогнозирования моделируемого показателя, учета их влияния на точность модели.

    Можно выделить следующие типичные задачи анализа и преобразования исходного пространства признаков:

    а) редукция описания объекта непосредственно в ходе корреляционно-регрессионного анализа;

    б) группировка признаков, состоящая в выделении групп тесно связанных между собой признаков с последующим выбором представителей групп. Она может быть дополнена требованием формирования "групповых" факторов вместо выбора представителей групп. Возможна модификация этой задачи, заключающаяся в выделении относительно "независимых" групп признаков;

    в) снижение размерности признакового пространства, основанное на переходе к новым координатам, замене исходных признаков их линейными комбинациями.

    Рассмотрим более подробно каждую задачу с учетом не только преимуществ, но и ограничений результатов ее решения.

     Одна из существенных трудностей (9) многофакторного регрессионного анализа - наличие мультиколлинеарности, то есть линейных связей между независимыми переменными1. Явная мультиколлинеарность обнаруживается при высоких значениях парных коэффициентов ( > 0,7). В этом случае один из признаков должен быть исключен из анализа. Вопрос о том, какую переменную исключить, решается на основе сравнения Ryxi с Ryxj (оставляют переменную с большим значением Ryx) и целей анализа. Однако даже при исключении сильно коррелированных признаков общий суммарный эффект мультиколлениарности может оказаться довольно существенным при сравнительно малых значениях Rxixj. Это проблема методического уровня. Но и в методологическом плане статистические методы не могут определить меры полностью изолированного влияния факторов, так как роль факторов проявляется только в их взаимодействии. Возможно получение не чистой оценки действия факторов, а выявление значимости каждого из них в определенной структуре. Это накладывает известные ограничения на интерпретацию и использование результатов анализа.

    Задача группировки признаков сводится к выявлению на основе анализа структуры матрицы данных групп тесно связанных между собой признаков и выбора затем из каждой группы признаков-представителей для использования их при построении модели. Это позволяет существенно сократить размерность исходного признакового пространства. Кроме того, анализ структуры связей и формирование групп тесно связанных признаков представляет самостоятельный интерес, так как позволяют выявить определенные объективные закономерности в структуре пространства признаков, что дает дополнительную ценную с содержательных позиций информацию для выбора переменных модели.

    Дело в том, что существует достаточно много способов "прямого" определения информативного набора признаков для регрессионной модели. С их помощью непосредственно из исходного набора можно получить сокращенный набор максимальной информативности. Однако "прямые" методы выбора информативного набора представляют собой формализованные процедуры и набор максимальной информативности не всегда будет наилучшим с содержательной точки зрения. Между тем, имея результаты анализа структуры связей признаков, можно подобрать из тех же групп другие, более характерные признаки и при очень небольшой потере в аппроксимирующей способности сконструировать более совершенные с позиций качественного анализа модели.

    Основной причиной широкого распространения методов группировки признаков в экономико-статистических исследованиях является то, что в качестве представителей групп выступают сами исходные признаки. Тем самым снимается проблема интерпретации, которая возникает при использовании методов факторного анализа и других подобных подходов.

    К недостаткам метода группировки признаков следует отнести определенные потери информации, особенно если сформированы группы со сравнительно небольшим уровнем тесноты внутригрупповых связей. Кроме того, отобранные таким способом признаки-представители не являются ортогональными, хотя взаимосвязь между ними очень часто слаба.

    В случае использования симметричных матриц связи решение задачи группировки признаков сводится по существу к "диагонализации" матрицы: в преобразованной матрице вдоль главной диагонали выделяются блоки с большими элементами (значениями показателей силы связи), а элементы, расположенные вне блоков, относительно малы. Признаки, входящие в одну группу, обладают большей силой связи между собой, чем признаки, принадлежащие к разным группам. Существует целый ряд алгоритмов решения задачи диагонализации: от эвристических до строго формальных.

    Помимо описанных методов группировки признаков для снижения размерности признакового пространства можно использовать процедуры факторного и компонентного анализа.

    Существо методов факторного анализа (7) состоит в переходе от описания некоторого множества изучаемых объектов, заданного большим набором косвенных, непосредственно измеряемых признаков, к описанию меньшим числом максимально информативных глубинных переменных, отражающих наиболее существенные свойства явления. Такого рода переменные, называемые факторами, являются некоторыми функциями исходных признаков.

    Описание фактора отыскивается в виде так называемой факторной матрицы или матрицы факторных нагрузок A размерностью n х m (- число признаков, m - число факторов), которая строится на основе матрицы парных корреляций R размерностью n х n. Корреляционная матрица отражает степень взаимосвязи между каждой парой признаков; факторная матрица характеризует степень связи между каждым из n рассматриваемых признаков и m факторами, выявленными в процессе анализа. При этом число m факторов выбирается исходя из двух условий: m должно быть много меньше n, а уровень потерь информации достаточно мал.

    Факторная матрица позволяет выделить для каждого фактора группу параметров, наиболее тесно с ним связанных. Тем самым открывается возможность сопоставить факторы друг с другом, дать им содержательное толкование и наименование, то есть осуществить интерпретацию факторов.

    Преобразование корреляционной матрицы в факторную не является однозначным. Для выбора факторной матрицы, на основе которой будет проводиться интерпретация факторов, разрабатываются специальные приемы. Обычно выбирается та матрица, в которой исходные параметры сильно связаны с одним из факторов и слабо связаны со всеми другими.

    Общая идея методов факторного анализа состоит в следующем. Требуется, чтобы данная система исходных параметров была хорошо представлена (описана, аппроксимирована) с помощью некоторой системы факторов. Для этого строится критерий (последовательность критериев), имеющий смысл степени качества представления данной системой факторов системы исходных параметров. Значение критерия можно определить по матрице факторных нагрузок. После того как такой критерий построен, задача о нахождении искомой матрицы факторных нагрузок ставится как задача экстремизации построенного критерия. Таким образом, факторный анализ с формальной точки зрения - это, прежде всего, несколько критериев качества матрицы факторных нагрузок и набор алгоритмов поиска экстремумов этих критериев.

    Различные критерии формализуют различные содержательные представления о том, что означает хорошее сжатие информации. Поэтому при практическом использовании факторного анализа полезно проведение анализа исходного материала многими методами. Сопоставление результатов дает возможность выделить существенное, общее в проведенных преобразованиях. В частности, наличие большого сходства между результатами, полученными с помощью различных методов обработки, означает, что сжатое представление исходного материала действительно отражает существо информации, представленной в этом материале, так как практически не зависит от способа формализации.

    Факторный анализ тесно связан с другими многомерными статистическими методами, особенно с компонентным анализом (10). Несмотря на внешнее сходство моделей и вычислительных процедур, постановки задач факторного и компонентного анализа существенно различаются.

    Компонентный анализ приводит к выделению статистически независимых обобщенных факторов, которые называются главными компонентами. В получаемых компонентах воспроизводится суммарная дисперсия исходных факторов, однако для описания основной доли дисперсии достаточна лишь небольшая их часть. В компонентном анализе осуществляется жесткая процедура выбора главных компонент и исключен субъективный подход. Исходные переменные преобразуются в новые переменные - главные компоненты, являющиеся линейными комбинациями исходных факторов. Главные компоненты обладают рядом свойств, которые делают их удобными для экономического анализа:

  • статистическая независимость;

  • ранжирование по степени их вклада в суммарную дисперсию исходных переменных, что дает возможность выразить информацию, содержащуюся в большом наборе взаимосвязанных исходных переменных, с помощью меньшего числа независимых главных компонент.

    Для проведения дальнейшего анализа требуется рассмотреть, насколько тесно каждая переменная в отдельности может быть связана с выделенным набором главных компонент. Исследование ведется на основании так называемых нагрузок, которые фактически являются оценкой тесноты связи исходных переменных и компонент. Именно через эти оценки каждая компонента получает свою содержательную интерпретацию.

    Ограничение применения компонентного анализа связано с более высокими требованиями к точности исходных данных. В случае существенных ошибок измерения исходных данных более оправдано применение факторного анализа, который наряду со сжатием информации позволяет выделить ошибки в характерные факторы и исключить из анализа.

    Факторный и компонентный анализы могут использоваться как основной, а также как дополнительный аппарат исследования, позволяющий упростить и сделать более корректным применение других статистических методов.

    Переход от множества первоначальных независимых переменных к меньшему числу общих факторов позволяет существенно снизить размерность пространства "входных" переменных и таким образом решить проблему отбора существенных факторов. Это позволяет производить построение уравнений регрессии и оценку параметров даже при небольших объемах совокупностей.

    Зачастую невозможно включить в модель переменные, важные с точки зрения поставленной задачи, из-за отсутствия необходимых данных в действующей отчетности и т.д. Между тем, общие факторы отражают также свойства и переменных, не включенных в анализ, но относящихся к тому же классу, что и переменные, выбранные для исследования.

    Общие факторы ортогональны между собой, благодаря чему решается проблема мультиколлинеарности.

    7.2.3. Пути построения адекватных моделей. Некоторые решения

    Построение адекватных моделей связано с решением следующих задач.

    1. Учет многомерности выходного параметра модели.

    Существенный недостаток применения корреляционно-регрессионного статистического инструмента исследования при моделировании и прогнозировании инвалидности состоит в том, что игнорируется существенная комплексность механизма формирования инвалидности, выражающаяся в частности во взаимосвязях и взаимообусловленности отдельных показателей инвалидности. Пофакторный подход, когда отдельно устанавливается регрессионная связь каждого из показателей инвалидности со своим набором факторов-детерминант, искусственно разъединяет систему характеристик, описывающих единое явление, на отдельные компоненты, рассматриваемые изолированно от остальных показателей.

    Для решения подобных задач была предложена принципиально иная логика использования математико-статистического аппарата, опирающаяся на методы классификации многомерных наблюдений и методы снижения размерности (10).

    Многомерная статистика рассматривает совокупность изучаемых многомерных объектов как совокупность точек или векторов в пространстве описывающих их признаков. Каждый объект социальной сферы характеризуется, с одной стороны, некоторым набором факторов-детерминант (например, социально-демографических и других признаков, описывающих условия существования объекта), а с другой - набором параметров поведения.

    Решение общей проблемы, связанной с выявлением структуры и дифференциации, распадается в соответствии с принятой в данной работе логической схемой на следующие этапы:

    – сбор и первичная обработка данных;

    – выявление основных типов с помощью разбивки исследуемого множества точек-объектов на классы в пространстве признаков, описывающих тип поведения;

    – отбор наиболее информативных типообразующих признаков (факторов-детерминант). Неправомерно рассчитывать на то, что диапазоны возможных значений каждого из типообразующих признаков окажутся непересекающимися для объектов разных типов потребительского поведения. Естественно считать наиболее информативными те факторы-детерминанты или те их наборы, разница в законах распределения которых оказывается наибольшей при переходе от одного класса к другому. Эта идея была положена в основу метода отбора наиболее информативных типообразующих признаков.

    Отобрав небольшое число наиболее информативных факторов-детерминант, исследуемая совокупность объектов вновь разбивается на классы, но уже в пространстве отобранных типообразующих признаков. При этом результат разбивки существенно зависит не только от состава группы наиболее информативных типообразующих признаков, но и от того, каким образом вычисляется расстояние между двумя точками-объектами в этом пространстве и, в частности, с какими весами участвуют в этом расстоянии отобранные типообразующие признаки. Веса подбирают таким образом, чтобы результат разбивки объектов на классы в пространстве наиболее информативных факторов-детерминант в некотором смысле наименее отличался бы от разбивки тех же объектов, которая получается в пространстве их поведения. Таким образом находится однозначное соответствие этих структур.

    2. Учет неоднородности совокупности (статика).

    Анализируя возможность построения моделей с применением корреляционно-регрессионного анализа, мы вновь возвращаемся к сформулированным в предыдущем разделе проблемам адекватности модели.

    Важной частью экономико-статистического исследования является анализ однородности сформированной совокупности и выбор наиболее рационального для данных условий типа модели.

    Общеизвестно, что статистические закономерности носят усредненный характер и многофакторные регрессионные модели, как правило, дают хорошую аппроксимацию лишь для объектов, близких к средним. Таким образом, регрессионная модель применима к индивидуальному объекту только в однородных совокупностях. Однородность здесь понимается в смысле справедливости полученных статистических закономерностей формирования социально-экономических показателей для каждой единицы совокупности.

    В терминах статистического моделирования достаточная степень однородности будет обеспечена, если многомерное распределение моделируемого показателя и существенно влияющих на него факторов близко к нормальному, иначе говоря, когда статистическая совокупность состоит из одного образа, одного класса, а искажение происходит за счет влияния несущественных с точки зрения цели моделирования факторов и некоторых "шумов".

    Рассмотрим сферу приложения двух классических подходов к достижению однородности рассматриваемых групп объектов: комбинационных группировок и методов многомерной классификации.

    При использовании методов комбинационной группировки классификация осуществляется путем последовательного логического деления совокупности по отдельным признакам. Все элементы сформированных групп обладают одинаковыми значениями комплекса признаков группировки. Другими словами, достаточным и необходимым условием принадлежности единицы совокупности к данной группе является наличие соответствующих значений комплекса группировочных признаков. В пределах набора признаков группировки элементы групп неразличимы.

    В ходе развития научных исследований было установлено, что принципы чистой логики, лежащие в основе метода комбинационной группировки, нелегко применять к эмпирическому материалу. Часто можно обнаружить естественные типы явлений, каждый из которых объединяет индивидуальные явления, обладающие большим числом общих признаков, но никакой естественный тип невозможно выразить через небольшой набор совпадающих признаков. В некоторых случаях те или иные объекты можно без всяких сомнений отнести к определенному типу, несмотря на отсутствие или несовпадение у них нескольких признаков из числа использованных при формировании групп. Все это обусловило необходимость разработки новых принципов многомерной классификации, отличных от классических, суть которых состоит в том, что классификация объектов производится не последовательно по отдельным, а одновременно по большому числу признаков.

    При использовании комбинационной группировки объект, отклоняющийся от нормы, характерной для группы, по одному единственному признаку набора, будет автоматически исключен из группы. Более того, если этот признак используется на первом этапе группировки, то объект может легко попасть в группу, очень далекую от той, с которой он в действительности имеет наибольшее сходство. Таким образом, осуществляя классификацию методом комбинационных группировок, исследователь часто искусственно разрушает реально существующие в пространстве признаков обособленно-однородные классы жестко заданными интервалами признаков. Этот основной недостаток делает комбинационные группировки неэффективными для выделения типов объектов по комплексу признаков, так как с добавлением каждого нового признака опасность разрушения объективно существующих однородных групп возрастает. Следовательно, основное преимущество методов многомерной классификации заключается в том, что они позволяют с той или иной степенью приближения наметить и выделить реально существующие в признаковом пространстве скопления точек-объектов, что связано с одновременной группировкой по большому числу признаков и использованием в качестве границ сложных поверхностей.

    Приведенная краткая характеристика корреляционно - регрессионного анализа и методов многомерной классификации свидетельствует о том, что эти два вида методов эмпирического изучения связей хорошо дополняют друг друга. Комплексное применение обоих методов позволяет существенно расширить сферу приложения методов регрессионного анализа, хотя во многих случаях аппарат многомерной классификации может выступать и как самостоятельный инструмент построения модели социально-экономического процесса. При совместном их применении на первом этапе проводится разбивка совокупности объектов на классы "близких" точек. В каждом из выделенных классов строится своя функция регрессии. В отличие от обычной регрессионной функции, параметры которой остаются стабильными для всех объектов совокупности, здесь параметры модели различны для выделенных областей. Сходства и различия полученных моделей для разных типов объектов несут в себе содержательную информацию о характере и степени влияния факторных признаков.

    3. Анализ устойчивости зависимостей во времени

    Существует два принципиально различных подхода к анализу устойчивости статистических зависимостей во времени. Первый из них сводится к анализу устойчивости характеристик исходной выборки, второй - к анализу устойчивости параметров модели.

    Суть первого подхода состоит в проверке идентичности не самих уравнений, а условий, которые обеспечивают эту идентичность. Этим условием является стабильность во времени основных параметров исследуемой совокупности. В качестве критерия стабильности может выступать близость классификации объектов по данным нескольких лет. Алгоритм реализации этой проверки может выглядеть следующим образом. Если имеются данные о некотором числе объектов, характеризующихся определенным набором признаков за два года, то вначале производится группировка этих объектов независимо от года. Образуется некоторое число классов - s. Затем производится разбивка на k новых групп - по году. Результаты двойной группировки представляют в виде таблицы взаимной сопряженности номеров групп и числа лет. По таблице взаимной сопряженности вычисляется значение 2 - Пирсона и сравнивается с табличным. Возможны и другие способы решения данной задачи.

    Принципиально другой подход к проверке гипотезы устойчивости основан на анализе поведения параметров пространственных моделей во времени. Может исследоваться устойчивость модели в целом и устойчивость ее отдельных элементов. В качестве критерия общей устойчивости моделей принимается разность оценки моделируемого показателя по моделям прошлого и "своего" периодов. В случае, когда разность не выходит за пределы двух-трех среднеквадратичных отклонений, модель считается в целом устойчивой, а если к тому же степень потери точности находится в допустимых пределах, то модель прошлого периода в целом может выступать как прогностическая. Это утверждение относится лишь к прогнозированию уровня моделируемого показателя, но не к характеру влияния факторов. Более обоснован путь анализа устойчивости отдельных элементов моделей. В него входят (в порядке ужесточения требований) оценки устойчивости:

    а) структуры пространственных моделей (то есть набора информативных переменных) и их совокупного влияния на моделируемый показатель;

    б) соотношений по степени влияния отдельных факторов;

    в) абсолютных значений свободного члена и коэффициентов регрессий.

    Способ решения первой задачи сравнительно прост. Для каждого из пространственных уравнений регрессии независимо определяется набор информативных переменных и рассчитываются коэффициенты множественной корреляции. Полное или близкое совпадение информативных наборов позволяет сделать вывод о временной устойчивости структуры моделей, а перекрытие доверительных интервалов множественных коэффициентов корреляции свидетельствует об устойчивости совокупного влияния информативных признаков на моделируемый показатель.

    Один из простых примеров проверки устойчивости соотношения величины параметров при отдельных переменных заключается в анализе результатов их ранжирования по степени влияния на анализируемый показатель. Постоянная величина рангов отдельных параметров или слабое изменение их во времени свидетельствует об определенной устойчивости.

    Материалы целого ряда прикладных исследований позволяют сделать следующие выводы о поведении пространственных моделей во времени.

    Как правило, характеристики исходной выборки устойчивы по парам последующих лет и неустойчивы за более длительный период.

    Из параметров регрессий наиболее неустойчив свободный член, он меняется от года к году. Более стабильны коэффициенты регрессий, которые для двух последующих лет различаются несущественно. Наиболее устойчивыми во времени элементами пространственной модели являются набор существенных (информативных) факторов, их ранжирование по степени влияния на моделируемый показатель и коэффициенты множественной корреляции. Эти характеристики чаще всего остаются стабильными в течение пяти-восьми и более лет.

    Характер изменения отдельных коэффициентов регрессии различен, по большинству из них не удается выявить монотонной устойчивой тенденции.

    Возникает вопрос о причинах столь резкого изменения значений коэффициентов регрессии во времени. Можно предположить, что динамика коэффициентов пространственных моделей обусловливается воздействием изменений собственного влияния данной переменной и типологической структуры совокупности. Содержательный анализ и опыт многих исследований позволяет утверждать, что основным, преобладающим источником неустойчивости параметров пространственных регрессий во времени являются изменения структуры при сравнительно стабильном влиянии отдельных переменных. Отсюда следует вывод о сравнительной устойчивости параметров модели в пределах однородного класса (типа) объектов.

    Таким образом, практический анализ временной устойчивости пространственных моделей дает основание рекомендовать для использования в краткосрочном прогнозе пространственных моделей прошлого года. В среднесрочном прогнозе пространственные модели прошлого периода без их корректировки неприменимы. Возникает необходимость в построении общей динамической модели и прогнозировании ее параметров.

    7.2.4. Методы динамизации пространственных моделей

    Рассмотрим подходы к построению динамической модели в следующих случаях:

    а) типологическая структура совокупности однородна;

    б) мы имеем дело со структурно-неоднородными совокупностями, меняющимися во времени.

    Возможная процедура преобразования набора пространственных моделей в общую динамическую состоит из двух этапов:

  • построение новых уравнений регрессии, учитывающих лаги и тенденции;

  • выявление и учет динамики коэффициентов полученных уравнений регрессии.

    Общая схема динамизации статических многофакторных моделей совокупности объектов вкратце сводится к следующему:

  •  строится набор пространственных регрессий за каждый год исследуемого периода;

  •  на основе динамических моделей отдельных типичных объектов с длительной предысторией выявляются лаги и тенденции;

  •  с учетом полученных характеристик производится преобразование исходной информации (сдвиг факторов во времени, введение новых переменных, введение разных форм фактора времени);

  •  строится новый набор пространственных моделей по преобразованной информации;

  •  исследуется динамика параметров полученного набора пространственных уравнений регрессии.

    Основное содержание описанной схемы сводится к прогнозированию параметров модели будущего периода. Эта же задача может быть решена и другим путем: вместо того чтобы прогнозировать параметры модели, перенести саму выборку в планируемый период путем прогнозирования значений показателей и факторов. В этом случае модель строится по перенесенной, спроектированной в будущее информации.

    Построение динамических моделей совокупности объектов с неоднородной пространственно-временной структурой сопряжено с некоторыми трудностями, обусловленными тем, что в процессе работы необходимо учесть не только динамику взаимосвязей показателей с влияющими факторами, но и изменение классификации во времени.

    Изменение типологической структуры включает следующие процессы:

  • дрейф характеристик существующих классов (их центров и границ);

  • изменение численности классов за счет перемещения объектов из класса в класс и появление новых объектов;

  • появление новых классов и исчезновение отдельных старых классов.

    Задача построения динамической модели сводится к выявлению, оформлению и анализу процессов в однородных пространственно-временных блоках. Выделяют два аспекта: выделение объектов одного характера развития в рассматриваемом интервале времени; выбор для этих однородных (в смысле истории развития) объектов участков траектории со стабильным характером взаимосвязи показателей и факторов.

    Для решения задачи в общем случае необходимо провести разбивку объектов за весь исследуемый временной интервал и для каждой из полученных групп построить динамическую модель. Выделение однородных групп объектов за общее число лет при большом числе объектов довольно громоздкая и порой неразрешимая задача. Дело в том, что в связи с дрейфом характеристик классов во времени такая пространственно-временная разбивка может привести к получению большого числа малочисленных классов, к которым невозможно применить статистические методы анализа. Поэтому чаще всего приходится использовать однородные группы объектов за каждый год исследуемого периода и анализировать характер изменения элементов развития во времени.

    Таким образом, моделирование динамического процесса включает следующие действия: выделение устойчивых классов, оценку динамики характеристик классов и определение пространственно-временных типов, построение динамических многофакторных внутриклассовых моделей.

    7.3. Информационная база исследования

    При выборе существенных параметров первичной инвалидизации населения следует исходить из того, что они должны отражать основные структурные характеристики инвалидности, такие как:

  • причины инвалидности,

  • тяжесть инвалидности,

  • возрастно-половые особенности,

  • место жительства.

Непосредственный перечень показателей представлен в приложении 1.

Наиболее полным и близким по времени к нашему исследованию, является работа по изучению факторов первичной инвалидизации населения, предпринятая специалистами в области эпидемиологии инвалидности совместно со специалистами в области математической обработки и анализа данных. Результатом работы оказался перечень существенных факторов, значимо влияющих на состояние и региональную вариацию инвалидности в России. Для каждого фактора приведен набор статистических индикаторов.

Проанализируем ограничения исследования, не позволяющие непосредственно использовать его результаты для прогноза инвалидности.

Для сбора данных о факторах инвалидности предпринято специальное исследование по существенно более широкой программе, чем та, по которой ведется сбор данных социальной статистики в соответствии с программой статотчетности. Таким образом, для того чтобы получить сведения о всех факторах в динамике, необходимо продублировать аналогичное исследование в течение нескольких лет, что не является реальной задачей.

Несмотря на то, что от исследования нас отделяет всего несколько лет, возникает проблема устойчивости результатов и необходимость в связи с этим обновления информационного массива. Прошедшие годы привели к качественным социальным сдвигам, что повлияло на оценку существенности тех или иных факторов инвалидности.

Наконец, существенным является то обстоятельство, что в рамках данного исследования не ставилась задача анализа влияния факторов на масштабы инвалидности с учетом ее внутренней структуры. Причиной этого были объективные обстоятельства, прежде всего - отсутствие адекватной статистики о структурных параметрах инвалидизации населения.

Таким образом, при создании базы данных о факторах инвалидности в рамках собственного исследования мы опирались на известные результаты, скорректировав их с учетом публикуемой программы разработки данных социальной статистики и с учетом воспроизводимости основного набора данных о факторах в динамике.

8. Заключение

Под влиянием резко изменившихся политических, экономических и социальных условий в России перестройка структуры общества привела к изменению социального статуса миллионов граждан, к снижению достигнутого ими жизненного уровня. Особенно существенно эти процессы отразились на инвалидах. Для выработки социального прогноза и определения путей дальнейшего развития и совершенствования системы социальной защиты потребовалась разработка методов, позволяющих оценивать и прогнозировать динамику инвалидности.

Используемые до настоящего времени методы прогнозирования в современных условиях оказались неприемлемыми, так как они ориентированы на период стабильного развития общества и не позволяют учитывать влияние резко изменяющихся условий в экономической, политической и социальной сферах общества. Поэтому особенно актуальной являлась задача оценки динамики инвалидности и разработки прогностической математической модели инвалидности в условиях резко изменяющихся общественных явлений.

Решение этой задачи было разбито на несколько этапов:

  1.  Разработка концепции социально-экономических показателей инвалидности;

  2.  Построение прогностической математической модели, учитывающей основные тенденции динамики показателей инвалидности;

  3.  Сбор статистических данных;

  4.  Верификация математической модели на реальных данных.

На первом этапе в качестве исходной была принята концепция инвалидности как сложная многофакторная проблема, согласно которой показатели инвалидности зависят от различных факторов на данной административной территории РФ: от демографической ситуации, экологической обстановки, социально-экономических показателей, заболеваемости, уровня медицинского обслуживания и др. Инвалидность при этом интерпретируется как интегральный показатель среды существования и условий жизни. Ряд внешних факторов (денежные доходы на душу населения, вредные условия труда, неблагоприятная экологическая обстановка) рассматриваются как причина инвалидности, а ряд факторов (например, количество врачей на душу населения) в том числе и как следствие инвалидности. Таким образом, инвалидность рассматривается как социально-экономический процесс, характеризующийся изменяющимися во времени и в пространстве связями между показателями инвалидности и внешними факторами окружающей среды, а в качестве объектов, порождающих такие процессы, рассматриваются как территория России в целом, так и отдельные административные территории РФ.

Такие объекты представляют собой большие сложные системы, обладающие свойствами управляемости, стохастичности поведения, неполноты информации о будущих состояниях и свойством инерционности.

Выбор структуры математической модели на втором этапе в большой степени определяется особенностью имеющихся статистических данных. Поскольку последние должны удовлетворять свойству сопоставимости, следует ограничиться короткими рядами динамики. Объем пространственных выборок соответствует количеству административных территорий РФ.

Первичный статистический анализ имеющихся данных включает следующие этапы:

  1.  Анализ трендов;

  2.  Получение статистических характеристик - математического ожидания, дисперсии, асимметрии, эксцесса, моды, медианы;

  3.  Анализ функций распределения;

  4.  Анализ корреляционных зависимостей, при котором особое внимание уделяется анализу временных изменений корреляционных зависимостей.

Первичный анализ данных позволил выявить следующие основные закономерности рассматриваемых процессов.

  •  По характеру динамики показателей инвалидности выявлены не только районы с постоянным ростом и постоянным уменьшением показателей, но и районы, где происходит смена направления тенденции изменения показателей инвалидности. Соответственно для таких районов ошибка прогнозирования на основе линейного тренда может превысить 60%.

  •  Пространственный анализ показателей инвалидности показал, что законы их распределения в основном отличны от нормального и за редким исключением могут быть хорошо описаны логнормальным распределением.

  •  В имеющихся временных рядах с показателями инвалидности наблюдаются изменения по времени таких параметров распределения как математическое ожидание, дисперсия, асимметрия, эксцесс и, следовательно, рассматриваемые временные ряды являются нестационарными.

  •  Анализ корреляции между соседними точками для всех показателей инвалидности позволил сделать вывод о высокой зависимости значений показателей инвалидности от предыстории процесса.

  •  Для внешних факторов характер распределения является слабо выраженным и в большинстве случаев приближение к тем или иным законам распределения является условным.

  •  Число сильно коррелирующих (коллинеарных) внешних факторов оказалось незначительным.

  •  Каждый показатель инвалидности коррелирует с большим числом внешних факторов.

  •  Степень взаимосвязи внешних факторов с показателями инвалидности во времени для разных факторов изменяется по-разному.

  •  Парные коэффициенты корреляции внешних факторов с показателями инвалидности с лаговым интервалом в один год могут значительно изменяться со временем.

Таким образом, первичный анализ статистических данных позволил сделать следующие выводы.

  1.  Для описания и прогнозирования инвалидности непригоден традиционный аппарат трендов, поскольку в переходный нестабильный период времени показатели инвалидности подвержены резким изменениям.

  2.  Применение традиционного корреляционно-регрессионного анализа из-за изменения структуры внешних факторов со временем, из-за дрейфа характеристик распределений показателей инвалидности и внешних факторов, из-за изменения со временем взаимных коэффициентов корреляции между внешними факторами и показателями инвалидности может быть использовано лишь для описания взаимосвязи между изменениями внешних факторов и изменениями значений показателей инвалидности.

 Наиболее перспективной представляется концепция прогностической математической модели, основанной на учете изменений структуры процесса, порождающего инвалидность.