Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции. Статистика.docx
Скачиваний:
6
Добавлен:
30.07.2019
Размер:
118.88 Кб
Скачать

Анализ взаимосвязи дух количественных признаков.

Для количественные признаков анализ осуществляют в 3 этапа.

  1. Построение поля корреляции. Поле корреляции - это график, который визуализирует характер связи. Как правило используют точечный график. Анализ графика позволяет:

А) выдвинуть гипотезу о форме связи.

Б) Диагностировать наличие выбросов.

Например: Изучается взаимосвязь Х – время на дорогу в ВУЗ. У – количество опозданий на занятие в неделю.

х

У

40

4

50

5

25

1

35

2

45

3

90

6

По характеру расположения точек на графике можно предположить, наличие прямой связи между признаками. Т.е. чем дольше студент добирается до универа, тем чаще он опаздывает.

Также по графику диагностируется выброс или нетипичное значение. Для проведения конкретного анализа выброс исключаем из совокупности, поэтому дальнейший анализ изучаем по 5-ти студентам

Второй этам Вычисление и интерпритаци коэффициента кореляции

Коэффициент Пирсена R(xy) считать его в экселе,

Для наших данных коэффициент пирсона получился 0,904, было обнаружена сильная или тесная связь, т.е. временные затраты на дорогу и частота опозданий существенно взаимосвязаны. Обнаруженная связь прямая, т.к. коэффициент больше 0, следовательно наша гипотеза подтвердилась, следовательно наша гипотеза подтвердилась чем дольше студент добирается до вуза, тем чаще опаздывает.

Проверка коэффициента кореляции на статистическую значимость, выполняется по этапам:

А) Расчитывается наблюдаемое значение tнаблюдаемое=Корень ((r2/ 1-r2)* (n-2))=Корень((0,9042)/1-0,9042)*(5-2)) = 3,660.

По таблице стбюдента находят t табличное, при этом необходимо задать следующие параметры :

Б)

  1. tтабличное Альфа=0,01

  2. Число степеней свободы df=n-2=3

  3. В таблице находим число на пересечении альфа и df. Т табичное = 3,182

В) Сравнивают табличное и наблюдаемое значение. Если т табличное больше т наблюдаемое то делаем вывод, что коэффициент статистический не значим, Данная связь получилась случайным образом и в генеральной совокупности может не обнаружится. А если наоборот, то коэффициент статистический значим и в генеральной совокупность значим.

В нашем случае наблюдаемое значение больше табличного следовательно связь между временными затратами на дорогу в вуз и частотой опозданий может быть обнаружена.

Если из выборочной совокупности по каким то причинам нельзя исключить выбросы, то для анализа взаимосвязи коэффициент Пирсона использовать нельзя и нужно использовать коэффициент Спирмона. Он также используется для анализа взаимосвязи пордковых признаков

ДЗ 6:

Проанализировать взаимосвязь между доходами и возрастом респондента с помощью коэффициента Пирсона.

Анализ связи порядковых признаков.

Этапы анализа те же самые что и для количественных признаков.

5 Потребителей проставляли ранги 2-м товарам:

Результат аранжирования представлены в таблице:

Потребитель

Ранг товара А

Ранг товара Б

Разница в рангах Di

(Di)2

Иванов

5

2

3

9

Петров

3

4

-1

1

Сидоров

2

3

-1

1

Путин

4

1

3

9

Мирославкий

1

5

4

16

Сумма 36

1-й этап Построение поля корреляции. Связь обратная.

2-этап – расчёт коэффициента Спирмена.

РО =1-(6*сумма d2i)/n(n2-1)

Di – разница в рангах

РО = 1-(6*36/5*(52-1))=-0,8

Между аранжируемыми товарами обнаруживается тесная взаимосвязь, причём эта связь обратная.

Проверка коэффициента на статистическую значимость.

А) tнабл.= Корень (ро2/ 1-ро2)* (n-2))=Корень((-0,82)/1-0,82)*(5-2)) = 2,31

Б) tтабичное= альфа=0,05, DF= n-2=3. Т табличное=3,182

В) сравниваем табличное и наблюдаемое значения. КОЭФФИЦИЕНТ статистический не значим/

Расчёт коэффициента Спирмена количественных данных в которых ранги ещё не проставлены.

Студенты

Время на дорогу

Опоздание

Di

D2

1

Значение 40

Ранг 3

Значение 4

Ранг 4

-1

1

2

50

5

5

5

0

0

3

25

1

1

1

0

0

4

35

2

2

2

0

0

5

45

4

3

3

1

1

6

90

6

6

6

0

0

РО = 1-(6*2/6(62-1))= 0,943 - связь сильная и прямая.

Связанные ранги.

Хi= 10,15,15,20,25,25,25,30 одинаковые ранги – связанные рангиприсваивается средний изрангов.

Ранг: 1 2,5;2,5 4 6 6 6 8

Для даных о Доходе и возрасте расчитать и интерпретировать коэффициент Спиремеа.