Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
2
Добавлен:
19.01.2025
Размер:
2.21 Mб
Скачать

Решение Задача 1. Контрольная работа 1 по теме

Число наблюдений: 8, количество интервалов гистограммы:

 

 

3

;

минимальное

значение X:

 

; максимальное

значение X:

 

 

 

ширина

интервала

гистограммы:

 

 

 

.

 

 

 

10

 

30

10 /3 6,67

 

 

30

 

 

 

 

 

Представим статистическое распределение в виде таблицы 13. Гистограмма частот представлена на рисунке 3.

Таблица 13 – Интервалы изменения величины X

Интервал

Частота

Нижняя граница

Верхняя граница

 

10

3

3

15

1

1

20

2

2

28

1

1

30

1

1

Рис. 3. Гистограмма частот для задачи 1. Контрольная работа 1.

Задача 2. Контрольная работа 1 по теме 1.

Коэффициент асимметрии: 0,34

Коэффициент

3

 

 

 

0,6

Его ошибка:

 

 

 

 

 

 

 

 

 

 

 

 

 

эксцесса:

Э 0,19

 

Его ошибка:

Э

0,25

 

 

Проверка

 

 

 

 

 

условий:

1,5

 

0,34 0,9 т. е | |

 

21

0,64 0,37 т. е Э

6

Э

9

1,5

Ответ : нет оснований принять гипотезу о нормальном распределении случайной величины X.

Задача 3. Контрольная работа 1 по теме 1.

Решение задач контрольной работы, связанных с определением параметров распределения представлена в Приложении В.

ТЕМА 2. РАСЧЕТ ПАРНЫХ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ

2.1 Расчет парного коэффициента корреляции Пирсона

Задача для решения в классе (пример 2.1).

Используя статистику Всемирного Банка о ВВП 2016 года и о стоимости основных производственных фондов на душу населения в 2015 году по 10 странам центральной Европы и Азии (таблица 14, рисунок 4). необходимо сделать предположение о характере взаимосвязи показателей, рассчитать коэффициент корреляции Пирсона и проинтерпретировать результат.

Таблица 14 – Исходные данные к примеру 2.1

 

Номер

ВВП в 2016 г., цены 2000

Стоим. ОПФ в 2015 г., цены 2000

Страна

наблюдения

на душу, тыс. долл. США

на душу, тыс. долл. США

 

i

Y

X

Армения

1

3,9

0,9

Болгария

2

8,0

1,6

Беларусь

3

6,2

2,1

Киргизия

4

1,0

0,4

Македония

5

5,2

1,3

Румыния

6

10,1

2,4

Россия

7

11,5

2,5

Турция

8

14,1

4,0

Украина

9

2,8

0,4

Узбекистан

10

2,0

0,5

Решение

1.1 Предварительный анализ графического материала

Поле корреляции переменных X и Y показано на рисунке 3. Точки лежат близко к одной прямой, что говорит о наличии статистической линейной взаимосвязи между показателями. Оба показателя нормированы (ВВП и ОПФ рассчитаны на душу населения). Судя по графику, с увеличением X растет Y, и наоборот, то есть взаимосвязь между переменными прямая.

22

Рис. 4. Поле корреляции ВВП (Y) и ОПФ (X) на душу населения 10 стран

1.2 Расчет парного линейного коэффициента корреляции Пирсона

Рассчитаем парный линейный коэффициент корреляции Пирсона между переменными Y и X по формуле (6), а вспомогательные расчеты запишем в таблицу 15.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 15 –Вспомогательные расчеты к задаче 2.1

 

 

 

 

 

 

 

 

i

 

Y

 

X

 

 

 

 

 

 

 

 

 

̅

 

 

̅

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

̅

 

 

1

 

3,9

 

0,9

 

 

 

-2,6

 

 

6,7

 

 

-0,7

 

 

0,5

 

 

1,83

 

 

2

 

8,0

 

1,6

 

 

 

1,5

 

 

2,3

 

 

0,0

 

 

0,0

 

 

-0,02

 

 

3

 

6,2

 

2,1

 

 

 

-0,3

 

 

0,1

 

 

0,5

 

 

0,2

 

 

-0,14

 

 

4

 

1,0

 

0,4

 

 

 

-5,5

 

 

30,0

 

 

-1,2

 

 

1,5

 

 

6,63

 

 

5

 

5,2

 

1,3

 

 

 

-1,3

 

 

1,6

 

 

-0,3

 

 

0,1

 

 

0,40

 

 

6

 

10,1

 

2,4

 

 

 

3,6

 

 

13,1

 

 

0,8

 

 

0,6

 

 

2,86

 

 

7

 

11,5

 

2,5

 

 

 

5,0

 

 

25,2

 

 

0,9

 

 

0,8

 

 

4,47

 

 

8

 

14,1

 

4,0

 

 

 

7,6

 

 

58,1

 

 

2,4

 

 

5,7

 

 

18,21

 

 

9

 

2,8

 

0,4

 

 

 

-3,7

 

 

13,5

 

 

-1,2

 

 

1,5

 

 

4,45

 

 

10

 

2,0

 

0,5

 

 

 

-4,5

 

 

20,1

 

 

-1,1

 

 

1,2

 

 

4,97

 

 

 

64,80

 

16,10

 

 

0,00

 

170,70

 

 

0,00

 

 

12,13

 

 

43,67

 

 

Среднее

 

6,48

 

1,61

 

 

0,00

 

17,07

 

 

0,00

 

 

1,21

 

 

4,37

 

23

 

43,67

0,96

170,7 12,13

Для 10 стран, попавших в выборку, взаимосвязь между ВВП и ОПФ на душу населения прямая, т.к. 0, и весьма высокая, поскольку 0,9 | | 0,99 (интерпретация по шкале Чеддока2).

1.3 Проверка гипотезы о равенстве значимости коэффициента корреляции

Пирсона

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сформулируем гипотезу о значимости коэффициента корреляции.

 

 

H0: коэффициент корреляции между

Y

 

и

X

незначим

(равен

нулю)

в генеральной совокупности,

 

 

.

между

Y и

X значим

в генеральной

1

коэффициент

корреляции

 

H :

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

совокупности,

 

0

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитаем стандартную ошибку коэффициента корреляции по формуле

(7) и расчетное значение критерия для проверки гипотезы по формуле (8).

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

(7)

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

(8)

 

 

 

 

 

 

 

 

 

РАСЧ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

0,96

 

0,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

РАСЧ

 

0,96

 

 

 

 

 

 

 

 

 

 

 

Когда

нулевая

гипотеза верна,

критерий

 

 

распределен

 

по

закону

0,1

9,6

 

 

 

Стьюдента. Найдем критическую границу для

уровня значимости

 

 

 

и

 

РАСЧ

 

 

 

 

0,05 .

числа степеней свободы по таблице:

 

 

;

2

 

 

Сравним

расчетное

значение

критерияКРИТс

 

0,05; 8

2,31

:

 

0

.

 

 

 

 

 

 

 

 

критическим:

| РАСЧ|

КРИТ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким

 

 

образом,

нулевая гипотеза

 

отклоняется,

и

принимается

альтернативная, то есть коэффициент корреляции значим с вероятностью не более 0,95%.

2 Шкала Чеддока: Если

0,1

|

|

0,3

, связь слабая,

0,3

| |

0,5

– умеренная,

0,5

| | 0,7

– заметная,

0,7

|

|

0,9

– высокая,

0,9

| |

0,99

– весьма высокая.

 

 

 

 

 

 

 

24

Задача для решения в классе (пример 2.2).

Имеются данные по зерну: валовые сборы, посевные площади, количество внесенных удобрений и средние цены (таблица 16А).

Определите, какие факторы влияют на величину валовых сборов зерна. Таблица 16А – Исходные данные к примеру 2.2

 

 

 

 

 

 

 

 

Средние цены

Посевные

Внесено

 

i

Регион

3

 

1

2

 

 

на зерно,

площади под

минеральных

Валовые

 

 

тыс.руб./т.

зерно, млн га

удобрений,

сборы, млн ц

 

 

 

 

млн ц

 

1

Белгородская обл.

6,9

0,75

0,38

25,0

2

Брянская область

4,9

0,31

0,09

5,9

3

Владимирская обл.

7,2

0,08

0,03

1,8

4

Воронежская обл.

6,6

1,39

0,45

31,1

5

Ивановская область

7,8

0,06

0,01

1,2

6

Калужская область

6,1

0,08

0,03

1,7

7

Костромская обл.

5,7

0,05

0,00

0,6

8

Курская область

6,5

0,95

0,44

28,4

9

Липецкая область

7,2

0,76

0,50

18,7

10

Московская область

6,2

0,09

0,05

2,4

11

Орловская область

6,7

0,77

0,38

20,7

12

Рязанская область

6,3

0,51

0,21

10,6

13

Смоленская область

6,2

0,12

0,02

2,2

14

Тамбовская область

6,3

0,89

0,29

18,7

15

Тверская область

5,8

0,07

0,01

0,8

16

Тульская область

8,1

0,47

0,20

11,4

17

Ярославская область

6,5

0,05

0,02

0,8

Решение

Получим в Excel матрицу парных линейных коэффициентов корреляции Пирсона между переменными модели с использованием надстройки «Анализ данных»/Корреляция (рисунок 5) приведена матрица. Эта матрица симметрична относительно главной диагонали, поэтому Excel выводит только нижний треугольник, под главной диагональю. На диагонали стоят коэффициенты корреляции переменных с самими собой, и они всегда равны 1. Определим, значимы ли полученные коэффициенты корреляции на основании использовать t-критерия Стъюдента. Для каждого коэффициента проверяем гипотезу о значимости коэффициента корреляции нулю.

25

Рис. 5. Матрица корреляций Пирсона для примера 2.2

H0: коэффициент корреляции

между

Y

и

X

незначим

(равен нулю)

в генеральной совокупности,

 

 

.

Y и

X значим

в

генеральной

1

 

 

корреляции

между

H : коэффициент

 

 

0

 

 

 

 

 

 

 

совокупности,

 

.

 

 

 

 

 

 

 

 

 

 

Результаты

проверки сведем в таблицу 16Б.

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

Расчетное

значение

критерия

 

определяем

по

формуле

(8). Табличное

значение определяем по таблице распределений Стъюдента (Таблица А1. приложение А) с параметрами уровень значимости α и число степеней свободы

 

 

. Уровень значимости возьмем по умолчанию равным 0,05. Число

степеней свободы составит 15.

 

15)=2,13.

 

 

 

 

2

 

 

 

 

 

 

 

Таблица 16Б – проверка

 

КРИТ 0,05;

 

 

 

 

 

 

 

 

значимости коэффициентов корреляции

 

 

Переменные

Коэфф. корреляции r

РАСЧ

КРИТ

 

Вывод

 

X1

и X2

 

 

0,1623

0,68

2,13

| РАСЧ|

КРИТ

 

X1

и X3

 

 

0,2633

1,06

2,13

X1

и Y

 

 

 

0,2068

0,82

2,13

| РАСЧ|

КРИТ

 

X2

и X3

 

 

0,9335

10,07

2,13

| РАСЧ|

КРИТ

 

X2

и Y

 

 

 

0,9734

16,33

2,13

| РАСЧ|

КРИТ

 

X3

и Y

 

 

 

0,9574

12,84

2,13

| РАСЧ|

КРИТ

 

 

 

 

 

 

 

 

 

| РАСЧ|

КРИТ

 

И значений коэффициентов корреляции видно, что 2 и 3 сильно и значимо связаны с , а взаимосвязь между 1 и Y статистически незначима.

Ответ: основываясь на расчетах парных коэффициентов корреляции Пирсона, можно говорить о сильной взаимосвязи валовых сборов зерна с

26

посевными площадями и количеством внесенных удобрений. Валовые сборы и цена на зерно статистически не связаны.

2.2 РЕАЛИЗАЦИЯ РАСЧЕТА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ ПИРСОНА С ИСПОЛЬЗОВАНИЕМ EXCEL

Расчет коэффициента корреляции Пирсона в MS Excel можно получить вызвав меню «Данные»/«Анализ данных»/«Корреляция». Результат расчета представлен в таблице 16В.

Таблица 16ВОтчет «Корреляция» в Excel

 

Y

X

Y

1

0,959796

X

0,959796

1

Проверка значимости коэффициента корреляции в Excel в отчете «Корреляция» не реализуется. Поэтому проверку значимости коэффициента корреляции следует осуществлять по формулам (7), (8).

Общие выводы по задаче 2.1: Коэффициент корреляции подтвердил предположение, сделанное по графику разброса: существует прямая линейная взаимосвязь между стоимостью основных производственных фондов на душу населения и валовым внутренним продуктом на душу населения. Связь можно охарактеризовать как весьма высокую. Поскольку коэффициент корреляции значим, этотвыводсправедливдлявсехстран, похожихнате10, которыепопали в выборку. Напомним, что коэффициент Пирсона позволяет делать выводы только о линейных связях, и с его помощью нельзя определить причину и следствие.

2.3 Расчет парных ранговых коэффициентов корреляции Спирмена и Кендалла

Задача для решения в классе (пример 2.2).

В результате проведения экспертного опроса были выбраны два наиболее компетентных дантиста, которые проранжировали факторы риска заболевания

27

десен по степени ослабевания (таблица 17). Определите согласованность экспертов, рассчитав коэффициенты ранговой корреляции Спирмена и Кендалла.

ФАКТОРЫ РИСКА:

1.Наследственность;

2.Курение;

3.Несоблюдение ежедневной гигиены полости рта;

4.Преобладание в рационе кислой пищи;

5.Преобладание в рационе пищи с повышенным содержанием сахара;

6.Избыточный вес.

Таблица 17 – Исходные данные к примеру 2.2

Эксперты (j)

 

 

Ф А К Т О Р Ы РИСКА (i)

 

 

 

 

 

 

 

 

 

1

2

3

4

 

5

6

 

 

1

1

2

4

5

 

3

6

2

1

4

2

5

 

1

3

Решение

2.2.1 Расчет коэффициента корреляции Спирмена

Определим согласованность дантистов с помощью коэффициента ранговой корреляции Спирмена. Обозначим: 1, 2 – это дантисты; – число факторов риска.

Впервую очередь осуществим проверку стандартизированности

представленных

ранжировок.

Обозначим

как

 

ранги,

выставленные

первым и вторым экспертом i-му фактору риска

соответственно.

 

;

 

 

Проверка условия стандартизированной ранжировки по первому эксперту:

 

 

 

 

 

 

 

. Ранжировка стандартизирована.

Проверка

; 21

; 21

21

эксперту:

условия

 

стандартизированной ранжировки по второму

 

 

 

 

; 16

; 16

21.

Ранжировка

не является

 

 

 

 

стандартизированной. Переход к стандартизированным ранжировкам и вспомогательные расчеты представим в таблице 18.

Таблица 18 – Процедура стандартизации рангов при решении примера 2.2

Эксперты (j)

 

 

Ф А К Т О Р Ы РИСКА (i)

 

 

 

 

 

 

 

 

1

2

3

4

5

6

 

Z1i

1

2

4

5

3

6

Z2i

1,5

5

3

6

1,5

4

 

 

 

 

 

 

 

(Z1i-Z2i)2

0,25

9

1

1

2,25

4

28

 

Расчёт рангового коэффициента Спирмена осуществим по формуле (9).

 

– число

 

 

1

 

Z

 

 

 

 

 

 

,

 

 

 

1

 

2

2

(9)

, где

 

факторов риска

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

, где

 

 

12

 

 

 

(10)

– число групп связанных рангов j-го дантиста;

– количество факторов, входящих в t-ю группу связных рангов.

 

 

,

 

,

 

 

6

 

 

 

 

(11)

 

 

 

 

 

 

 

 

 

1

12

1

12

 

 

 

 

 

 

 

 

 

 

Рассчитаем

 

 

,

1

6

6 17,5

1

0,5

 

0,5

 

 

6

 

 

 

коэффициент корреляции Спирмена при наличии связанных

рангов с использованием поправочных коэффициентов по формулам (10)-(11).

1

 

 

0;

 

6

12

2

2

 

0,5

 

,

 

0,5

 

6

 

6

0

0,5

 

0,49

 

 

 

 

 

 

 

12 0

 

 

 

 

12 0,5

 

 

дисциплине «Эконометрика» коэффициент ранговой

В дальнейшем в

1

6

 

6

 

1

6

6

 

корреляции Спирмена будет использоваться для проверки остаточной компоненты на гетероскедастичность.

2.2.2 Проверка значимости коэффициента корреляции Спирмена

Проверим значимость полученного коэффициента корреляции Спирмена с

помощью критерия Стъюдента по формуле (12).

 

 

РАСЧ

 

 

,

 

 

 

(12)

 

 

 

 

 

 

 

1

 

,

 

 

 

 

 

 

2

 

 

 

Расчетное значение критерия Стъюдента :

РАСЧ

0,60876

1,534647

1 0,3705884

 

 

29

 

 

 

 

 

 

Табличное значение:

КРИТ

;

2

 

КРИТ 0,05; 4

2,776445

 

 

Ответ: поскольку табличное значение превышает расчетное

 

, то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

95%, а значит

мнения дантистов следует считать независимыми с вероятностьюКРИТ

РАСЧ

 

несогласованными.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.2.3 Расчет коэффициента корреляции Кендалла

 

 

 

 

 

Теперь определим согласованность двух дантистов с помощью

коэффициента ранговой корреляции Кендалла по формулам (13)-(15).

 

 

, где

 

– число

 

 

,

1

 

4

 

 

, ;

 

 

(13)

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

факторов риска

 

 

 

 

 

 

 

 

 

 

 

, где

 

 

 

 

 

 

∙ ∑

 

 

 

 

,

 

(14)

 

 

 

 

 

 

 

 

 

– число групп связанных рангов j-го эксперта;

 

 

 

– количество факторов, входящих в t-ю группу связных рангов

 

 

 

 

 

 

 

 

 

 

,

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(15)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Матрицу предпочтений дантистов и инверсии представим в виде таблицы

19.

Таблица 19 – Определение числа инверсий при решении примера 2.2

Сравнение факторов

Эксперт 1

Эксперт 2

Инверсия (0/1)

Фактор 1 и Фактор 2

>

>

0

Фактор 1 и Фактор 3

>

>

0

Фактор 1 и Фактор 4

>

>

0

Фактор 1 и Фактор 5

>

=

1

Фактор 1 и Фактор 6

>

>

0

Фактор 2 и Фактор 3

>

<

1

Фактор 2 и Фактор 4

>

>

0

Фактор 2 и Фактор 5

>

<

1

Фактор 2 и Фактор 6

>

<

1

Фактор 3 и Фактор 4

>

>

0

Фактор 3 и Фактор 5

<

<

0

Фактор 3 и Фактор 6

>

>

0

Фактор 4 и Фактор 5

<

<

0

Фактор 4 и Фактор 6

>

<

1

Фактор 5 и Фактор 6

>

>

0

30