Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Готовые шпоры (2).doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
522.75 Кб
Скачать

3.3. Выбор формы связи

Определ-е формы связи изучаемого эк-кого показ-ля с выбранными фак-рами-аргументами, т.е. спецификация - один из наиболее сложных и ответственных этапов корреляционно­го анализа.

От правильности выбора зависит, наск-ко построенная мо­дель будет адекватна изучаемому явл-ю, а это в значительной степени предопределяет практическую ценность по­лучаемых рез-татов. Запас кривых для выравнивания стат.данных бесконечно разнообразен. Для выбора той из них, ко­т.наиболее адекватна не только имеющемуся эмпирическому материалу, но и истинному отнош-ю завис-ти м/у изу­чаемым эк-ким показ-лем и обуславливающими его фак­-рами, исходят из соображений логич., графич.и ста­тистич. хар-ра.

Как и при отборе фак-ров-аргументов, решающая роль при­надлежит (логическому) теоретич.обоснов-ю формы зави­с-ти. Существенную помощь при выборе формы связи, особенно при парной корреляции, оказыв.графич.анализ м/у ф-ци­ей и ее предполагаемыми аргументами. О типе теоретич.кри­вой в этом случае судят по внешнему виду эмпирического графика регрессии, устраняя мысленно те зигзаги, кот.можно предпо­ложить случайными.

С увел-ем числа фак-ров-аргументов надежность этого метода существенно сниж-ся, тем не менее, графич.анализ завис-ти м/у ф-цией и каждым ее аргументом в отдельно­сти мож.оказать помощь при определении формы множественной связи. Нпр., если все парные связи имеют линейный характер, то большая вероятность того, что в кач-ве формы связи мож.быть применена линейная форма ур-я множеств.регрес­сии.

Зачастую при выборе формы связи целесообразно исп.уже известные модели, описывающие процессы, аналогичные ис­следуемому. Однако ни один из этих способов не позволяет одно­значно выбрать ф-цию, наилучшим образом описывающую изу­чаемое явл-е. Поэт.на практике приходится определять ис­комый вид связи эмпирическим путем сравнения ряда моделей и выбора наилучшей из них с т.зрения принятого критерия срав­нения.

При прочих равных усл-ях предпочтение отдается модели, зависящей от меньшего числа парам-ров. Изучаемая совок-ть должна обладать достаточно большим числом степеней свободы вариации, определяемым соотнош-ем м/у численностью этой совок-ти и числом парам-ров ур-я множеств.рег­рессии.

В крайнем вырожденном случае, когда число парам-ров ур-я регрессии = числу наблюдений или сравнимо с ним, да­же если все критерии адекватности принимают свои предельные знач-я, а нормированная ошибка = нулю, полученная модель не имеет практического смысла.

Во всех остальных случаях высокий коэфф-т множеств.корреляции и соответствующий ему коэфф-т детермина­ции свидет-ют не только о том, что в окончательно отобранную модель включены все осн.фак-ры, но также о справед­ливости гипотезы о линейной форме связи.

Если выбранная линейная форма связи сильно искажает дейст­вительный нелинейный хар-тер завис-ти, то величина коэф­ф-та множеств.корреляции, вычисленная через парам-­ры ур-я регрессии будет значительно ниже индекса множе­ств.корреляции, определяемого через отнош-е дисперсии. В том случае, если полученная в рез-тате реш-я линейная мо­дель оказывается неадекватной, с т.зрения F-критерия Фишера или других критериев целесообразно переходить к параболической кривой, добавляя в ур-е значения неизвестных в квадрате и парные их произведения:

у = а0 + ах1 +а-х2

у = а0 + а1х1 + а2х2 + а3х21 + а4х22 + а5х1х2

Действуя, таким обр., и повышая порядок ур-я, можно подобрать модель, соотв-щую любому статистич.ма­териалу. Однако практическая ценность такой модели будет резко снижаться по мере увел-я числа ее парам-ров.

Счит-ся, что число наблюдений должно быть > числа парам-ров ур-я регрессии, по крайней мере, в 6-7 раз.

Поэт., если дальнейшее повыш-е степени полиномов на­талкивается на эту границу, следует расс.др.нели­нейные модели, нпр., модели мультипликативного типа:

y=Axa11*xa22…xapp

Данную завис-ть простым логарифмированием можно све­сти к завис-ти аддитивного типа:

ln у = ln А + а1 ln x1 + а 2 ln x2

Тем или иным способом найденную модель можно упростить, отсеяв статистически незначимые или, так наз.лишние фак-ры, кот.незначительно влияют на целевую ф-цию, и, в то же время, сильно коррелируют с остальными фак-рами. Для от­сева статистически незначимых фак-ров все включенные в модель фак-ры следует проранжировать по величине их значимости, т.е. по величине коэфф-та tai. Фактор, для кот.tai имеет наименьшее знач-е, признает­ся незначимым. После этого заново решается новая модель, зави­сящая от (р-1) фак-ра, и вся процедура повторяется. Этот процесс продолжается до тех пор, пока оставшиеся в модели фак-ры не окажутся статистически значимыми.

Эта процедура - метод многошагового регрессионного анализа. Его недостаток - чисто формальный характер процедуры, по при­чине которого из модели мог.быть исключены наиболее сущест­венные фак-ры. Для преодоления этого недостатка необх.использ.для ранжирования фак-ров, наряду с показ-лем t,j, более содержательный критерий. Одним из таких критериев мож.быть показ-ль суммы рангов.

Этот показ-ль вычисляется по рез-татам анкетного опроса широкого круга спец-тов. Каждому специалисту предлагается заполнить анкету, в кот.перечисляются фак-ры, отобранные для корреляционного анализа изучаемого показ-ля. Опрашивае­мый должен проранжировать эти фак-ры по степени их важности, при этом фак-ру, оказывающему наибольшее влияние на данный показ-ль, присваивается ранг 1 и т. д.

На основании данных анкетного опроса составляется сводная анкета, т.н. матрица рангов. Наименьшую сумму рангов будет иметь фактор, кот., с т.зрения экспертов, оказывает в среднем наибольшее влияние на изучаемый показ-ль. Соответственно наибольшую сумму ран­гов имеет фактор, оказывающий в среднем наименьшее влияние.

В отличие от показателей t-критерия Стьюдента, коэфф-­тов парной и частной корреляции, показ-ль суммы рангов не за­висит ни от объема и характера выборки, ни от вида модели, ни от числа включенных в нее фак-ров. Это делает данные показ-ли не только наиболее содержательными, но и наиболее объективны­ми показ-лями сравнительной сущности фак-ров.

Несущественные фак-ры следует исключить из модели, с уче­том величины t-критерия Стьюдента и коэфф-та, определяе­мого суммой рангов. Исключение из модели некоторых фак-ров не означает полно­го исключения их влияния. В той или иной степени (в меру своей связи с фак-рами, оставшимися в модели) они продолжают влиять на целевую ф-цию, но не явно.

Получаемая в рез-тате описываемого процесса конечная мо­дель не явл.единственно возможной. Можно получить не­ск-ко моделей с несущественно отличающимися коэфф-та­ми множеств.корреляции или показателями относительной ошибки. Окончат.выбор той или иной модели зависит от опыта исследователя и назначения модели.