Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kursovaya_Oxana.rtf
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
1.91 Mб
Скачать

6. Корреляционный и дисперсионный анализ

Статистические распределения характеризуются наличием более или менее значительной вариации в величине признака у отдельных единиц совокупности. Естественно, возникает вопрос о том, какие же причины формируют уровень признака в данной совокупности и каков конкретный вклад каждой из них. Изучение зависимости вариации признака от окружающих условий и составляет содержание теории корреляции.

Таблица 17 – Исходные данные

№ по порядку

Объем производства,

тыс. ц (х)

Выручка,

руб. (у)

у*х

х2

у2

ȳ

1

755,144

62725

47366407,4

570242,5

3934425,625

61363,7

2

499,151

36691

18314349,3

249151,7

1346229,481

48623,8

3

713,347

51311

36602548,0

508864,0

2632818,721

67212,5

4

652,693

59077

38559144,4

426008,2

3490091,929

95672,2

5

360,309

35570

12816191,1

129822,6

1265224,900

32104,2

6

425,243

36916

15698270,6

180831,6

1362791,056

37418,0

7

702,158

61030

42852702,7

493025,9

3724660,900

68785,9

Продолжение таблицы 17

8

731,734

65587

47992237,9

535434,6

4301654,569

64287,3

9

447,810

51299

22972205,2

200533,8

2631587,401

74065,7

10

827,853

58435

48375590,1

685340,6

3414649,225

72843,2

11

841,374

83312

70096550,7

707910,2

6940889,344

74115,0

12

234,771

18075

4243485,8

55117,4

326705,625

20867,6

13

549,395

44414

24400826,5

301834,9

1972603,396

42342,6

14

554,207

40630

22517430,4

307145,4

1650796,900

48786,9

15

943,038

101520

95737217,8

889320,7

10306310,400

82980,8

16

504,544

42048

21215066,1

254564,6

1768034,304

47565,4

17

142,024

11732

1666225,6

20170,8

137639,824

42406,4

Продолжение таблицы 17

18

372,085

30854

11480310,6

138447,2

951969,316

32706,4

19

394,429

29406

11598579,2

155574,2

864712,836

34706,5

20

644,340

48540

31276263,6

415174,0

2356131,600

36692,2

21

855,473

72564

62076542,8

731834,1

5265534,096

73245,6

22

435,781

38490

16773210,7

189905,1

1481480,100

38545,5

23

641,045

51108

32762527,9

410938,7

2612027,664

36607,3

24

466,878

38699

18067711,7

217975,1

1497612,601

48581,6

25

759,615

71623

54405905,1

577014,9

5129854,129

66846,7

26

278,527

20043

5582516,7

77577,3

401721,849

74907,8

27

806,334

92653

74709264,1

650174,5

8584578,409

70933,7

Продолжение таблицы 17

28

578,017

42049

24305036,8

334103,7

1768118,401

30981,2

Итого

16,141319

1396,407

988796,7998

10436,658

69304197,1

14204,554

Коэффициент корреляции равен 1, что свидетельствует о том, что связь между признаками, т.е. в данном случае объемом производства и выручкой очень высокая, тесная. Если предприятию необходимо увеличить выручку, то оно должно максимальные силы вложить в увеличение объема производства.

Дисперсионный анализ – это статистический метод оценки связи между факторным и результативным признаками в различных группах, отобранный случайным образом, основанный на определении различий (своеобразия) значений признаков. Факторным признакам, более существенны, чем случайные отклонения, то считается. В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонения берется дисперсия (В) – средний квадрат отклонений. Отклонения, вызываемые воздействием факторного признака (фактора) сравниваются с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонения, вызываемые, то фактор оказывает существенное влияние на результативный признак.

Для того, чтобы вычислить дисперсию значения отклонений каждой варианты (каждого зарегистрированного числового значения признака) от среднего арифметического возводят в квадрат. Тем самым избавляются от отрицательных знаков. Затем эти отклонения (разности) суммируют и делят на число наблюдений, т.е. усредняют отклонения. Таким образом, получают значения дисперсий.

Важным методическим значением для применения дисперсионного анализа является правильное формирование выборки. В зависимости от поставленной цели и задач выборочные группы могут формироваться случайным образом независимо друг от друга (контрольная и экспериментальная группы для изучения некоторого показателя, например, влияние высокого артериального давления на развитие инсульта). Такие выборки называются независимыми.

Одним из основных и наиболее распространенных методов обработки и анализа первичной статистической информации является группировка.

Под группировкой в статистике понимают расчленение единиц критической совокупности на группы, однородные в каком-либо суще­ственном отношении, и характеристику таких групп системой по­казателей в целях выделения типов явлений, изучения структуры и взаимосвязей.

Метод группировки является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений. По своей роли в процессе исследования метод группировки выполняет некоторые функции аналогичные функциям эксперимента в естественных науках

  1. Группировочный признак – объем производства.

Таблица 18 – Ранжированный ряд распределения районов объему производства.

№ по порядку

Объем производства, тыс. ц.

Выручка, тыс. руб.

1

2

3

1

142,024

11,732

2

234,771

18,075

Продолжение таблицы 18

1

2

3

3

278,527

20,043

4

360,309

35,570

5

372,085

30,854

6

394,429

29,406

7

425,243

36,916

8

435,481

38,490

9

447,810

51,299

10

466,878

28,699

11

499,151

36,091

12

540,544

47,048

13

549,395

44,414

14

554,207

40,630

15

578,017

42,049

16

641,045

51,108

17

644,340

48,540

18

652,602

53,407

19

702,235

40,425

20

715,347

58,706

21

731,754

68,267

22

745,144

80,225

23

759,445

71,623

Продолжение таблицы 18

1

2

3

24

806,134

52,225

25

827,823

58,429

26

841,974

82,302

27

855,473

72,564

28

943,038

241,520

На основе данной группировки проведем дисперсионный анализ.

Таблица 19 – Зависимость выручки от группировочного признака

Группы районов по группировочному признаку

Число районов

Выручка тыс. руб.

Средняя выручка тыс. руб.

1

2

3

4

142,624 – 409, 024

6

11,732; 18,075; 20,043; 35,570; 30,854; 29,406.

24,28

409,024 – 676,024

12

36,916; 38,490; 31,299; 38,699; 36,091; 42,048; 44,014; 40,639; 42,049; 51,108; 48,540; 43,407.

41,1

Продолжение таблицы 19

1

2

3

4

676,024 – 941,501

10

40,425; 58,706; 68,267; 80,225; 71,623; 52,225; 58,429; 82,302; 72,564; 241,520.

82,6

Итого

28

1465,3

52,3

Добщ = Дмеж + Двн;

12481,73 = 9237,129 + 3234,05

12481,73 = 12471,179

где, Добщ – общая дисперсия;

Дмеж – дисперсия межгрупповая;

Двн – дисперсия внутренняя.

Дисперсия общая, равна 12481,73, характеризует изменение выручки (результативного признака) за счет всех признаков (случайных и постоянных).

Дисперсия межгрупповая, равная 9237,129, характеризует меру зависимости выручки (результативного признака) за счет объема производства (факторного показателя).

Дисперсия внутригрупповая, равна 3234,05, характеризует меру зависимости выручки (результативного признака) за счет каких-то случайных факторов (неучтенных).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]