Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика БУАиА, ФиК 2013 02 / Дополнительный материал / Тема 3 Парная регрессия и корреляция.doc
Скачиваний:
179
Добавлен:
14.03.2015
Размер:
3.81 Mб
Скачать

Использование средств excel для решения примера.

Чтобы вычислить корреляцию средствами EXCEL, можно воспользоваться функцией =КОРРЕЛ( ),1указав адреса двух столбцов чисел, как показано на рис. 3.2.

Рис. 3.2.2. Вычисление коэффициента парной корреляции с помощью функции КОРРЕЛ. Ответ помещен в D8 и равен 0,816.

Критическое значение t – статистики Стьюдента может быть также получено с помощью функции СТЬЮДРАСПРОБР пакета EXCEL. В качестве аргументов функции необходимо задать число степеней свободы равное n-2 (в нашем примере 16-2=14) и значимость (в нашем примереравно 0,1). Если фактическое значениеt – статистики, взятое по модулю больше критического, то с вероятностью (1- ) коэффициент корреляции значимо отличается от нуля.

Рис. 3.2.3. Критическое значение t – статистики равно 1,7613.

В состав Microsoft Excel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения различных статистических задач. Для вычисления матрицы коэффициентов парной корреляции R следует воспользоваться инструментом Корреляция и установить параметры анализа в соответствующем диалоговом окне.

Рис. 3.2.3. Вычисление матрицы коэффициентов парной корреляции с помощью инструмента Корреляция пакет анализа.

Ответ будет помещен на новый рабочий лист (рис. 3.2.4)

Рис. 3.2.4. Матрица коэффициентов парной корреляции.

Оценка тесноты нелинейной связи.

При отклонении парной статистической зависимости от линейной коэффициент корреляции теряет свой смысл как характеристика степени тесноты связи. В этом случае можно воспользоваться таким измерителем связи как индекс корреляции(корреляционное отношение).

Корреляционное отношение- показатель уровня связи, употребляющийся в случае нелинейной зависимости между признаками, определяемыми через отношение межгрупповой дисперсии к общей дисперсии.

Применение корреляционного отношения возможно, если между парой исследуемых признаков отмечается нелинейная зависимость и характер выборочных данных (количество, плотность расположения на диаграмме рассеяния) допускает, во-первых, их группирование по оси объясняющей переменной, во-вторых, возможность подсчета “частных” математических ожиданий внутри каждого интервала группирования.

Для определения эмпирического корреляционного отношения совокупность значения результирующего признака yразбивают на отдельные группы. В основу группировки кладётся исследуемый факторx.

Когда изучаемая совокупность (в виде корреляционной таблицы) разбивается на группы по одному (факторному) признаку х, то для каждой из этих групп можно вычислить соответствующие групповые средние результативного признака. Изменение групповых средних от группы к группе свидетельствует о наличии связи результативного признака с факторным признаком, а примерное равенство групповых средних — об отсутствии связи. Следовательно, чем большую роль в общем изменении результативного признака играет изменение групповых средних (за счет влияния факторного признака), тем сильнее влияние этого признака.

Приведем методику вычисления корреляционного отношения.

Пусть группирование данных произведено. Пусть при этом k– число интервалов группирования по осих;– количество элементов выборки вj-ом интервале группирования; n — объем совокупности;— общее среднее.

Вычислим — среднее значениевj-й группе.

Вычислим общее среднее, используя средние значения в каждой группе

.

Найдем межгрупповую дисперсию

и общую дисперсию

.

Корреляционное отношение зависимой переменнойYпо независимой переменной Х может быть получено из отношения межгрупповой дисперсии к общей дисперсии

. (3.2.11)

Величина корреляционного отношения изменяется в пределах от 0 до 1. Близость ее к нулю говорит об отсутствии связи, близость к единице — о тесной связи.

Как показатель тесноты связи корреляционное отношение имеет более универсальный характер, чем линейный коэффициент корреляции, поскольку его использование не ограничивается случаями линейной связи, а факторный признак может быть не количественным, а ранговым и даже номинальным.

Пример 3.2.3.Объем выпускаемой продукции и температура.

В табл. 3.2.4 приведены данные, полученные в результате эксперимента, целью которого являлось определение тесноты связи между объемом выпуска продукции и температурой определенного технологического процесса.

Требуется:

              1. Построить диаграмму рассеяния (корреляционное поле) для этой совокупности данных.

              2. Оценить тесноту связи между объемом выпуска продукции и температурой.

Таблица 3.2.4.

Температура (х)

600

625

650

675

700

725

750

775

800

825

850

Объем выпуска продукции (Y)

127

139

147

147

155

154

153

148

146

136

129

Решение

1. Корреляционное поле, показанное на рис. 3.2.4., иллюстрирует сильную нелинейную взаимосвязь, характеризующуюся незначительным случайным разбросом.

Коэффициент парной корреляции, г = -0,0155, бесполезен в случае такой нелинейной связи: он не может решить, является связь увеличивающей или уменьшающей, поскольку в действительности есть и то и другое.

В этом корреляционное поле очень полезно, поскольку демонстрирует, что для максимального увеличения объема выпускаемой продукции температуру производственного процесса следует установить равной примерно 700 градусам. Объем продукции резко падает как при слишком высокой, так и при слишком низкой температуре. Этот важный вывод можно сделать, наблюдая на диаграмме сильную взаимосвязь между объемом продукции и температурой.

Замечание:близкое к нулю значение коэффициента корреляции может означать как отсутствие взаимосвязи в данных, так и наличие нелинейной взаимосвязи без преобладания направленности вниз или вверх. Сильная нелинейная взаимосвязь может быть даже тогда, когда корреляция близка к нулю!

Рис. 3.2.4. Нелинейная взаимосвязь объема выпускаемой продукции и температуры производственного процесса.

2. Оценим тесноту связи между объемом выпуска продукции и температурой с помощью корреляционного отношения.

Значения результирующего признака Yразобьем на 5 групп (k=5). В основу группировки кладётся исследуемый фактор x.

Таблица 3.2.5.

Номер группы

1

2

3

4

5

Количество элементов выборки в j-ой группе

2

2

3

2

2

Значения , попавшие в j-ю группу

127;139

147;147

155;154;153

148;146

136;139

Среднее значение вj-й группе

133

147

154

147

132,5

(133-143,727)2

(147-143,727)2

(154-143,727)2

(147-143,727)2

(132,5-143,727)2

Вычислим общее среднее, используя средние значения в каждой группе (см. табл. 3.2.5)

.

Найдем межгрупповую дисперсию

Вычислим общую дисперсию

Получим корреляционное отношение:

Полученное значение свидетельствует о наличии сильного нелинейного влияния температуры на объем выпуска продукции.

Пример 3.2.4.

В табл. 3.2 приведена информация о среднедушевых денежных доходах (в мес., руб.) и среднедушевых денежных расходах (в мес., руб.) по Центральному федеральному округу в 2002 г. [Россия в цифрах].

Табл. 3.2.

Центральный федеральный округ

Среднедушевые денежные доходы (в мес., руб.)

Среднедушевые денежные расходы (в мес., руб.)

Белгородская область

1

2784

2478

Брянская область

2

2255

2034

Владимирская область

3

2062

2019

Воронежская область

4

2553

2501

Ивановская область

5

1595

1668

Калужская область

6

2254

2188

Костромская область

7

2371

2217

Курская область

8

2518

2202

Липецкая область

9

2742

2392

Московская область (без г. Москва)

10

3416

3354

Орловская область

11

2540

2347

Рязанская область

12

2510

2309

Смоленская область

13

2843

2671

Тамбовская область

14

2648

2201

Тверская область

15

2204

1932

Тульская область

16

2561

2160

Ярославская область

17

3311

2921

Требуется:

  1. Построить однофакторную модель регрессии зависимости расходов от доходов.

  2. Построить доверительный интервал для полученной модели регрессии ().

  3. Проверить значимость параметров модели регрессии ().

  4. Оценить расходы, если доход составит 3600 руб.

    Доход-X

    Расход - Y

    Расход -

    Остатки

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    1

    2784

    2478

    148,94

    244,76

    59909,76

    36455,54

    2537,13

    -59,13

    3496,59

    2

    2255

    2034

    -295,06

    -284,24

    80789,70

    83866,13

    2087,43

    -53,43

    2854,98

    3

    2062

    2019

    -310,06

    -477,24

    227753,53

    147971,01

    1923,36

    95,64

    9146,30

    4

    2553

    2501

    171,94

    13,76

    189,47

    2366,72

    2340,76

    160,24

    25676,82

    5

    1595

    1668

    -661,06

    -944,24

    891580,29

    624195,07

    1526,37

    141,63

    20059,17

    6

    2254

    2188

    -141,06

    -285,24

    81359,17

    40234,96

    2086,58

    101,42

    10285,64

    7

    2371

    2217

    -112,06

    -168,24

    28303,11

    18852,25

    2186,04

    30,96

    958,34

    8

    2518

    2202

    -127,06

    -21,24

    450,94

    2698,13

    2311,01

    -109,01

    11882,49

    9

    2742

    2392

    62,94

    202,76

    41113,53

    12762,25

    2501,43

    -109,43

    11974,48

    10

    3416

    3354

    1024,94

    876,76

    768716,35

    898632,25

    3074,39

    279,61

    78180,82

    11

    2540

    2347

    17,94

    0,76

    0,58

    13,72

    2329,71

    17,29

    298,98

    12

    2510

    2309

    -20,06

    -29,24

    854,70

    586,43

    2304,21

    4,79

    22,98

    13

    2843

    2671

    341,94

    303,76

    92273,00

    103869,66

    2587,29

    83,71

    7007,78

    14

    2648

    2201

    -128,06

    108,76

    11829,76

    -13928,28

    2421,52

    -220,52

    48628,67

    15

    2204

    1932

    -397,06

    -335,24

    112382,70

    133108,13

    2044,08

    -112,08

    12561,29

    16

    2561

    2160

    -169,06

    21,76

    473,70

    -3679,52

    2347,56

    -187,56

    35179,08

    17

    3311

    2921

    591,94

    771,76

    595620,76

    456839,31

    2985,13

    -64,13

    4112,88

    сумма

    43167,00

    39594,00

    0,00

    0,00

    2993601,06

    2544843,76

    39594,00

    0,00

    282327,28

    среднее

    2539,24

    2329,06

    0,00

    0,00

    149696,69

    0,00

  5. Отобразить на графике исходные данные, результаты моделирования и прогнозирования.