Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпора стат.doc
Скачиваний:
10
Добавлен:
21.09.2019
Размер:
14.22 Mб
Скачать

21) Статистический анализ связи неколичественных переменных.

В практических задачах все чаще требуется измерение связей неколичественных переменных, измеренных на номинальных и порядковых шкалах. Это вызвано повышением внимания к изучению социальных процессов, где велика доля нечисловой информации. Развитие конкурентных рынков способствовало разработке методик построения рейтингов фирм, банков, учебных заведений. Рейтинг – по сути порядковая переменная, и для изучения зависимости рейтинга от каких-либо характеристик должны использоваться меры связи, предназначенные для порядковых переменных. При этом единицам совокупности присваиваются ранги по разным признакам, т.е. порядковые номера единиц совокупности в ранжированном ряду. Связь между ними определяется коэффициентом корреляции рангов. Коэффициент корреляции рангов Спирмена:

где Рх и Ру - ранги i -ой единицы совокупности по переменным x и y .

Путем преобразования приведенной формулы Спирмен получил выражение коэффициента ранговой корреляции: ,где d- разность рангов по переменным x и y для i-ой единицы совокупности.

Значимость коэффициента корреляции рангов можно проверить по t-критерию Стьюдента:

По таблице распределения Стьюдента находится критическое значение t – критерия. Если , то r-значим. При определении t используется число степеней свободы: . Уровень значимости а=1 – доверительная вероятность. Коэффициент корреляции рангов Кендэла дает более строгую оценку связей:

S – фактическая сумма рангов, - макс сумма рангов. S рассчитывается по рангам у. Для каждого ранга определяется число последующих рангов выше данного и вычитается число последующих рангов ниже данного. Измерение тесноты связи между номинальными переменными на основе таблиц сопряженности. Таблицы сопряженности - таблицы, в которых дается распределение по двум или более признакам. При анализе связи между дихотомическими переменными (то есть признаками, которые принимают два значения) используют таблицу сопряженности 2х2 (четырехпольная таблица). По таким таблицам рассчитавают коэффициент ассоциации:

; Коэффициент ассоциации принимает значения в интервале от о до 1. 0 – отсутствие связи, 1- полная связь. Недостаток данного показателя - становится равным единице. Если хотя бы одна из клеток равна нулю. Коэффициент контингенции:

Связь считается подтвержденной, если или

Коэффициент взаимной сопряженности Пирсона: Недостаток коэффициента Пирсона- он не достигает единицы при полной связи между признаками. Коэффициент взаимной сопряженности Чупрова: Квадрат коэффициента сопряженности Чупрова имеет смысл коэффициента детерминации. Коэффициент взаимной сопряженности Чупрова может достигать предельного значения, равного единице, только в случае квадратной таблицы .Чем более несимметрична таблица, тем больше Т отличается от единицы при полной связи признаков.Коэффициент Чупрова как правило более строго оценивает тесноту связи, чем коэффициент Пирсона. Коэффициент взаимной сопряженности Крамера:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]