- •Государственное образовательное учреждение высшего профессионального образования пермская государственная медицинская академия им. Ак. Е.А. Вагнера росздрава
- •Контрольные вопросы для повторения и изучения:
- •Задачи для самостоятельного решения
- •Вопросы для тестового контроля
- •Дополните:
- •Эталоны ответов:
- •Литература:
- •План работы на занятии
- •Информационный блок для студентов
- •Метод квадратов (Пирсона) вычисления коэффициента корреляции.
- •Последовательность расчета критерия X - квадрат.
- •Регрессионный анализ
- •Метод стандартизации
- •Типовое задание
Регрессионный анализ
Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных ( х1, х2, ….хk)
Основной предпосылкой регрессионного анализа является то, что только результативный признак (У) подчиняется нормальному закону распределения. В анализе динамических рядов в качестве факторного признака выступает время t. При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным (У) и факторными ( х1, х2, ….хk) признаками.
Уравнение регрессии, или статистическая модель связи социально-экономических явлений, выражаемая функцией _
Ух = f( х1, х2, ….хk)
Является достаточно адекватным реальному моделируемому явлению или процессу в случае соблюдения следующих требований их построения.
1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.
2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственных связей.
3. Все факторные признаки должны иметь количественное (цифровое) выражение.
4. Наличие достаточно большого объема исследуемой выборочной совокупности.
5. Причинно-следственные связи между явлениями и процессами следует описывать линейной или приводимой к линейной формами зависимости.
6. Отсутствие количественных ограничений на параметры модели связи.
7. Постоянство территориальной и временной структуры изучаемой совокупности.
Соблюдение данных требований позволяет исследователю построить статистическую модель связи, наилучшим образом аппроксимирующую моделируемые социально-экономические явления и процессы.
Теоретическая обоснованность моделей взаимосвязи, построенных на основе корреляционно-регрессионного анализа, обеспечивается соблюдением следующих основных условий:
1. Все признаки и их совместные распределения должны подчиняться нормальному закону распределения.
2. Дисперсия моделируемого признака (У) должна все время оставаться постоянной при изменении величины (У) и значений факторных признаков.
3.Отдельные наблюдения должны быть независимыми, т.е. результаты, полученные
в i-м наблюдении, не должны быть связаны с предыдущими и содержать информацию о последующих наблюдениях, а также влиять на них.
Отступление от выполнения этих условий и предпосылок ведет к тому, что модель регрессии будет неадекватно отражать реально существующие связи между анализируемыми признаками.
Одной из проблем построения уравнения регрессии является ее размерность, т. е. определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным.
Сокращение размерности за счет исключения второстепенных, несуществующих факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс в единой системе национального счетоводства.
Практика выработала определенный круг критерий, позволяющий установить оптимальное соотношение между числом факторных признаков, включаемых в модель, и объемом исследуемой совокупности. Согласно данному критерию число факторных признаков должно быть в 5-6 раз меньше объема изучаемой совокупности.
Статистический термин «регрессия» исходит из регрессии к среднему, возможно, описанной сэром Френсисом Гальтоном в 1889 г. Он показал, что хотя у высоких отцов часто бывают малорослые сыновья, средний рост сыновей меньше, чем их высоких отцов. Средний рост сыновей «регрессировал», или «двигался вспять», к среднему росту всех отцов в популяции. Таким образом, в среднем высокие отцы имеют более низких (но все-таки высоких) сыновей, а низкие отцы имеют более высоких (но все-таки низких) сыновей.
Мы наблюдаем регрессию к среднему при скрининге и клинических исследованиях, когда подгруппа пациентов может быть выбрана для лечения потому, что значения определенной переменной, скажем, уровень холестерина, крайне высоки (или низки). Если это измерение через некоторое время повторить, средняя величина второго считывания в подгруппе обычно меньше, чем таковая первого считывания, имея тенденцию (т.е. регрессируя) к среднему в популяции для соответствующего возраста и пола независимо от лечения, которое они могут получить. У пациентов, отобранных в клиническое исследование из-за высокого уровня холестерина при первом осмотре, таким образом, вероятно, уровень холестерина в среднем снизится при втором осмотре, даже если в этот период они не лечились.
Для сравнения общих показателей, вычисленных из неоднородных по своему составу совокупностей, применяется специальный метод – метод стандартизации.
