
- •1. Причинность, регрессия, корреляция.
- •Корреляционно – регрессионный анализ. Линейная парная регрессия.
- •Оценка линейного коэффициента корреляции
- •Шкала Чеддока
- •Показатели работы некоторых сельскохозяйственных предприятий Тамбовской области (данные условные)
- •Расчетная таблица
- •Нелинейная парная корреляция.
- •Производство и себестоимость продукции на одном из заводов Тамбовской области в 2011 году
- •Расчетная таблица
- •4. Множественная регрессия.
- •Исходные данные
- •Расчётная таблица
- •5. Непараметрические методы анализа.
- •Вспомогательная таблица для расчёта коэффициента взаимной сопряжённости
- •Зависимость освоения «Статистики» от типа школы, которую закончили студенты
- •Расчётная таблица
- •Расчётная таблица
- •Расчетная таблица
Нелинейная парная корреляция.
Пример 2. Используя данные таблицы 4, выявите характер связи между факторными и результативными признаками. Изобразите корреляционную связь графически. Измерьте тесноту связи с помощью коэффициента корреляции. Постройте адекватное уравнение регрессии, рассчитайте коэффициент Фишера и ошибку аппроксимации.
Таблица 4
Производство и себестоимость продукции на одном из заводов Тамбовской области в 2011 году
Месяцы |
Произведено продукции, тыс. штук. |
Себестоимость единицы продукции, руб. |
X |
Y | |
1 |
0,5 |
25,0 |
2 |
2,0 |
19,8 |
3 |
3,1 |
19,0 |
4 |
2,5 |
19,5 |
5 |
5,8 |
17,2 |
6 |
1,8 |
20,1 |
7 |
3,4 |
18,0 |
8 |
12,0 |
15,2 |
9 |
8,3 |
15,4 |
10 |
6,0 |
15,8 |
11 |
5,4 |
16,6 |
12 |
7,2 |
17,1 |
По данным о себестоимости единицы продукции и объёма произведенной продукции определим направление и тесноту связи между признаками. Представим вышеприведенные данные в таблице 5 после предварительной их обработки методом приведения параллельных данных.
Сопоставив полученные ряды данных x и y можно наблюдать наличие обратной зависимости между признаками, когда увеличение объёма произведенной продукции ведёт к снижению себестоимости единицы продукции. Исходя из этого, можно сделать предположение, что связь между признаками обратная, и ее можно описать уравнением гиперболы. Этот же вывод подтверждается и на основе графического анализа (рис.2).
Анализ рис.2 показывает наличие близкой к криволинейной зависимости, так как точки расположены по кривой линии – допустим, что это гипербола.
Уравнение гиперболы:
Рис. 2. Зависимость себестоимости единицы продукции от
объёма произведенной продукции.
Определим параметры уравнения гиперболы на основе метода наименьших квадратов. Исходные данные и расчетные показатели представлены в таблице 5.
Систему нормальных уравнений для нахождения параметров гиперболы можно представить следующим образом:
–Из первого
уравнения вычитаем второе.
Далее
Уравнение гиперболы:
Отсюда:
(19)
В уравнении регрессии а1 = 4,79 – коэффициент регрессии показывает, что с увеличением производства продукции на 1 тыс. штук, себестоимость продукции сокращается на 4,79 руб.
Проверим параметры данного уравнения на типичность. Для этого, используя формулы (3), (4), (5), (6), рассчитаем необходимые данные.
На основании выявленной модели (19) определим теоретические (выровненные значения себестоимости в зависимости от количества произведенной продукции) и запишем в табл. 5 (гр. 7):
Таблица 5
Расчетная таблица
месяцы
|
Производство продукции, тыс. штук
|
Себестоимость единицы продукции, руб.
|
|
|
|
|
|
( |
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
1 |
0,5 |
25,0 |
2,0 |
4,0 |
50,0 |
25,83 |
-0,83 |
0,689 |
-4,33 |
18,75 |
0,033 |
2 |
1,8 |
20,1 |
0,556 |
0,309 |
11,137 |
18,91 |
1,19 |
1,416 |
-3,03 |
9,181 |
0,059 |
3 |
2,0 |
19,8 |
0,5 |
0,25 |
9,9 |
18,651 |
1,15 |
1,320 |
-2,83 |
8,009 |
0,058 |
4 |
2,5 |
19,5 |
0,4 |
0,16 |
7,8 |
18,17 |
1,33 |
1,769 |
-2,33 |
5,429 |
0,068 |
5 |
3,1 |
19,0 |
0,323 |
0,104 |
6,129 |
17,8 |
1,2 |
1,44 |
-1,73 |
2,993 |
0,063 |
6 |
3,4 |
18,0 |
0,294 |
0,087 |
5,294 |
17,66 |
0,34 |
0,116 |
-1,43 |
2,045 |
0,019 |
7 |
5,4 |
16,6 |
0,185 |
0,034 |
3,074 |
17,14 |
-0,54 |
0,292 |
0,57 |
0,325 |
0,033 |
8 |
5,8 |
17,2 |
0,173 |
0,030 |
2,966 |
17,08 |
0,12 |
0,014 |
0,97 |
0,941 |
0,007 |
9 |
6,0 |
15,8 |
0,167 |
0,028 |
2,633 |
17,05 |
-1,25 |
1,563 |
1,17 |
1,369 |
0,079 |
10 |
7,2 |
17,1 |
0,139 |
0,019 |
2,375 |
16,92 |
0,18 |
0,032 |
2,37 |
5,617 |
0,011 |
11 |
8,3 |
15,4 |
0,121 |
0,015 |
1,856 |
16,83 |
-1,43 |
2,045 |
3,47 |
12,041 |
0,093 |
12 |
12,0 |
15,2 |
0,083 |
0,007 |
1,276 |
16,651 |
-1,45 |
2,104 |
7,17 |
51,409 |
0,095 |
ИТОГО |
58,0 |
218,7 |
4,941 |
5,043 |
104,461 |
218,69 |
х |
12,800 |
х |
118,109 |
0,618 |
Определим
по специальным таблицам распределения
Стьюдента (t
– распределение) (v=n-k,
где k
– число фактических признаков; v=
12-1-1=10) (приложение 3) tk
= 2,228.
Сравнение фактических и табличных значений t – критерия:
49,75 > 2,228 <
46,0
позволяет признать вычисленные по уравнению (19) параметры типичными.
Далее произведем оценку практической значимости синтезированной модели (19). Для криволинейной связи оценка производится посредством индекса корреляции R по формуле (20):
,
где
,
2
=
;
Определяем
индекс корреляции:
R
=
0,919
Полученная величина R = 0,919 означает, что в соответствии со шкалой Чеддока установленная по уравнению регрессии связь между себестоимостью единицы продукции и объёмом произведенной продукции весьма высокая.
Оценка значимости коэффициента корреляции R = 0,919 осуществляется по F – критерию Фишера.
Фактическое значение критерия FR определяется по формуле
(16)
где m – число параметров уравнения регрессии.
Величина FR
сравнивается с критическим значением
Fk,
которое определяется по таблице
F-критерия
с учетом принятого уровня значимости
и числа степеней свободыk2
= m
– 1 (знаменатель)
и k2
= n
– m
(числитель).
При уровне значимости
=0,5
и степенях свободыk2
=2-1=1 и k1
= 12 – 2 = 10,
табличное значение Fk
= 4,96. 54,35>4,96
, следовательно, величина индекса
корреляции признается существенной.
R2 – индекс детерминации = 0,9192 =0,8446 или 84,5%. Отсюда следует, что 84,5% общей вариации объясняется изменением факторного признака Х.
Проверка адекватности
всей модели осуществляется с помощью
F-критерия
и величины средней ошибки аппроксимации
.
Значение средней ошибки аппроксимации определяется по формуле:
(17)
и не должно превышать 12-15%.
Среднюю ошибку аппроксимации определим по формуле (17)
Средняя ошибка аппроксимации составляет 11,0%.
Поэтому синтезированная по уравнению гиперболы математическая модель (19) может быть использована для практических целей.