- •Курсовая работа
- •1.Оглавление
- •2.Цель работы, методы решения, исходные данные.
- •3. Построение точечных графиков диаграмм, гистограмм, отражающих зависимость данных величин.
- •4. Вычисление коэффициентов корреляции и детерминации.
- •5. Нахождение уравнений линейной регрессии y на X первой степени, полинома 2-ой и 3-ей степени. Построение их графиков.
- •6. Оценка статистической надежности результатов регрессионного моделирования.
- •7. Рассчет средней ошибки аппроксимации.
- •9. Выводы.
- •10. Список используемой литературы.
-
3. Построение точечных графиков диаграмм, гистограмм, отражающих зависимость данных величин.




-
4. Вычисление коэффициентов корреляции и детерминации.
С помощью коэффициента корреляции определяется степень зависимости между величинами. То есть после вычисления этого коэффициента, можно узнать, существует ли зависимость между прибылью и собственным капиталом.
Для вычисления коэффициента корреляции требуется вычислить:
-
средние арифметические значений X и Y (
и
); -
статистические дисперсии (
и
); -
статистический корреляционный момент (
); -
среднеквадратические отклонения (
и
).
-


=1362,5;

![]()
=68,44;
-


=99875,6;

![]()
=39,2;
-


=-1367,63;
-


=316,03;
![]()
![]()
=6,26.
Коэффициент корреляции:
=-0,69123.
Коэффициент детерминации:
=0,47779.
-
5. Нахождение уравнений линейной регрессии y на X первой степени, полинома 2-ой и 3-ей степени. Построение их графиков.
1)Рассмотрим уравнение линейной регрессии Y на X первой степени.
Воспользуемся методом наименьших квадратов:
,
.
,
,
,
.


a=-0,013693368;
![]()
b=87,09471374.
Искомое уравнение (y=ax+b): y=0,352961031x+171,1944234
Её график выглядит следующим образом:

2)Уравнение полинома 2-ой степени будет рассчитываться следующим образом:
,
.
,
,
,
,
,
![]()


П
одставим
значения в систему:
4672527247854,62a + 2933905770b + 1950039,63c = 129799431
1950039,63a + 1950039,69b + 1362,5c = 91963,94
1950039,63a +1362,5b + c = 68,44
a
=0,00001489802870
b=-0,0587179
c=119,3888533
Искомое уравнение: y=0,00001489802870x2 - 0,0587179x + 119,3888533
Её график выглядит следующим образом:

3)Уравнение полинома 3-ей степени будет рассчитываться следующим образом:
,
![]()

Подставим
значения в систему:
13700010444959700000d+7815329504959930c+46725527247857,62b+2933905770,5a= 192972893894,687
7815329504959930d+46725527247857,62c+2933905770,5b+1950039,625a=129779431,1875
46725527247857,62d+ 2933905770,5c+1950039,625b+1362,5a=91963,9375
2933905770,5d+1950039,625c+1362,5b+a=68,4375
a=-0,00000004917498413963
b=0,00023917056986910000
c=-0,38625971001630700000
d=272,89408615528500000000
Искомое уравнение: y = -0,00000004917498413963x3 – 0,00023917056986910000x2 + -0,38625971001630700000x + 272,89408615528500000000
Её график выглядит следующим образом:

-
6. Оценка статистической надежности результатов регрессионного моделирования.
Критерий Фишера
Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной y от среднего значения y на две части – “объясненную” и “остаточную”:
![]()
![]()
=
![]()
+
![]()
![]()
При расчете объясненной,
или факторной, суммы квадратов
![]()
используется теоретические (расчетные)
значения результативного признака
,
найденные по линиям :
=
a
* x
+ b
(для линейной регрессии первого
порядка),
=a
* x^2
+ b
* x
+ c
(для полинома второй степени),
=
a
* x^3
+ b
* x^2
+ c*x
+ d
(для
полинома третьей
степени).
Поскольку при заданном объеме наблюдений
по x
и y
факторная сумма квадратов при линейной
регрессии зависит только от одной
константы коэффициента регрессии a,
то данная сумма квадратов имеет одну
степень свободы . К этому же выводу
придем, если рассмотрим содержательную
сторону расчетного значения признака
y,
т.е.
.
Величина
определяется
по уравнению линейной регрессии:
=
a
* x
+b
.
Параметр a
можно найти как b
=
.
Подставив выражение параметра a
в линейную модель, получим:
.
Средний квадрат отклонений или дисперсию на одну степень свободы D
![]()
![]()
![]()
Значение m – число степеней свободы.
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-отношения, т. е. критерий F:
F = Dфакт / Dост
F-статистика используется для проверки нулевой гипотезы H0: Dфакт =Dост .
Если нулевая гипотеза H0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Если H0 несправедлива, то факторная дисперсия превышает остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F-отношений при разных уровнях значимости нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия – это максимальная величина отношения дисперсии, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным (отличным от единицы), если оно больше отличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи:
Fфакт > Fтабл, H0 отклоняется.
Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня и она может быть отклонена без риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым: не Fфакт < Fтабл, H0 отклоняется.
-
Для линейной регрессии
=
39,19583333
=
280,913
=
21,930
Fфакт = Dфакт / Dост= 12,80930725
Fa=0,05= 4,60 ; k1 = m = 1, k2 = n – m – 1 = 14
Fфакт > Fтабл.
-
Для полинома второй степени
=
39,19583333
=
166,498
=
19,611
Fфакт = Dфакт / Dост= 8,490080462
Fa=0,05=3,74; k1 = m = 2, k2 = n – m – 1 = 13.
Fфакт > Fтабл.
-
Для полинома третьей степени
=39,19583333
=134,9264716
=15,26317377
Fфакт = Dфакт / Dост=8,840001015
Fa=0,05=3,34; k1 = m = 3, k2 = n – m – 1 = 14.
Fфакт > Fтабл.
