Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МУ к контр раб по статистике Экономика 2014.docx
Скачиваний:
6
Добавлен:
01.07.2025
Размер:
4.34 Mб
Скачать
      1. 3. Методические советы по выполнению контрольной работы

При выполнении контрольной работы рекомендуется использовать литературу, указанные в списке рекомендуемой и дополнительной литературы.

Выполнению работы должны предшествовать ознакомление с соответствующими разделами курса и изучение рекомендованной литературы. Следует учитывать, что вследствие быстрых экономических преобразований происходит постоянные изменения в нормативных актах, составе и способе исчисления определенных показателей и т.д. Поэтому приведенный список литературы должен дополняться более новыми источниками (законы, инструкции, положения и т.д.).

При выполнении работы необходимо руководствоваться следующими правилами:

  • контрольная работа должна быть представлена в заочное отделение экономического факультета в установленные сроки;

  • контрольная работа должна быть выполнена аккуратно в тетради, страницы следует пронумеровать, оставить поля для замечаний преподавателя-рецензента, допускать лишь общепринятые сокращения слов;

  • в начале работы указывается номер варианта, замена одного варианта другим не допускается;

  • перед решением задачи должно быть полностью приведено ее условие;

  • решение задач следует сопровождать приведением необходимых формул развернутых расчетов, кратких пояснений;

  • каждая задача должна завершаться формулировкой выводов, раскрывающих экономическое содержание исчисленных показателей;

  • в конце работы следует привести список литературы;

  • работа должна быть подписана студентом с указанием даты ее выполнения;

  • если студент получил работу с подписью «на доработку», то работу необходимо дополнить, устранить все замечания и отдать повторно преподавателю на проверку.

Контрольная работа оформляется в объеме 20 – 25 страниц рукописного текста.

Выбор теоретического вопроса и задач контрольной работы производится исходя из предпоследней и последней цифр индивидуального шифра студента (Приложение 1).

Задача 1 составлена по теме «Сводка и группировка данных». В ней исследуется взаимосвязь изучаемых признаков с помощью аналитической группировки.

Пример решения задачи. Имеются следующие данные о рабочих-сдельщиках (табл. 1).

Таблица 1 - Исходные данные

№ п/п

Стаж работы, лет

Месячная выработка рабочего, руб.

№ п/п

Стаж работы, лет

Месячная выработка рабочего, руб.

1

1,0

2000

16

10,5

2760

2

1,0

2020

17

1,0

2340

3

3,0

2050

18

9,0

2700

4

6,5

2900

19

9,0

2640

5

9,2

2980

20

6,5

2520

6

4,4

2500

21

5,0

2410

7

6,9

2800

22

6,0

2560

8

2,5

2300

23

10,1

2620

9

2,7

2230

24

5,5

2450

10

16,0

3100

25

2,5

2400

11

13,2

2840

26

5,0

2440

12

14,0

3200

27

5,3

2520

13

11,0

2950

28

7,5

2530

14

12,0

2790

29

7,0

2520

15

4,5

2220

30

8,0

2620

Для изучения зависимости между стажем работы и месячной выработкой рабочих произведите группировку рабочих по стажу, образовав пять групп с равными интервалами. Каждую группу охарактеризовать: числом рабочих; средним стажем работы; месячной выработкой продукции - всего и в среднем на одного рабочего.

Применяя метод группировок для взаимосвязи, необходимо прежде всего определить факторный признак, оказывающий влияние на взаимосвязанные с ним признаки. Таким признаком в нашем примере является стаж работы, который должен быть положен в основание группировки. По условию требуется выделить пять групп рабочих по стажу с равными интервалами.

Сначала вычислим величину интервала группировочного признака (стажа работы) по формуле:

(1)

где - величина равного интервала;

и - максимальные и минимальные значения группировочного признака;

- предполагаемое число групп.

Для нашего примера величина равного интервала равна:

Следовательно, первая группа рабочих имеет стаж 1 - 4 года; вторая - 4 - 7 и т.д. По каждой группе надо подсчитать численность рабочих и оформить результаты в виде таблицы. Предварительно составим макет таблицы, который заполним сводными групповыми показателями (табл. 2).

Таблица 2 - Распределение рабочих по стажу работы

Группы,

№ п/п

Группы

рабочих по стажу, лет

Число рабочих, чел.

Средний стаж работы, лет

Месячная выработка, руб.

всего

на одного рабочего

1

1-4

2

4-7

3

7-10

4

10-13

5

13-16

Итого

Для заполнения макета таблицы составим рабочую таблицу 3.

Таблица 3 - Рабочая таблица

№ п/п

Группы рабочих по

стажу, лет

Номер

рабочего

Стаж, лет

Месячная выработка, руб.

1

1-4

1

1,0

2000

2

1,0

2020

3

3,0

2050

8

2,5

2300

9

2,7

2230

17

1,0

2340

25

2,5

2400

Итого

7

13,7

15340

2

4-7

4

6,5

2900

6

4,4

2500

7

6,9

2800

15

4,5

2220

20

6,5

2520

21

5,0

2410

22

6,0

2560

24

5,5

2450

26

5,0

2440

27

5,3

2520

Итого

10

55,6

25320

3

7-10

5

9,2

2980

18

9,0

2700

19

9,0

2640

28

7,5

2530

29

7,0

2520

30

8,0

2620

Итого

6

49,9

15990

4

10-13

13

11,0

2950

14

12,0

2790

16

10,5

2760

23

10,1

2620

Итого

4

43,6

11120

5

13-16

10

16,0

3100

11

13,2

2840

12

14,0

3200

Итого

3

43,2

9140

Всего

30

206

76910

Групповые показатели рабочей таблицы и исчисленные на их основе средние показатели занесем в соответствующие графы макета таблицы и получим сводную аналитическую таблицу 4.

Таблица 4 - Группировка рабочих по стажу работы

Группы,

п/п

Группы

рабочих по стажу, лет

Число рабочих, чел.

Средний стаж работы, лет

Месячная выработка, руб.

всего

на одного рабочего

1

1-4

7

1,95

15340

2191

2

4-7

10

5,56

25320

2532

3

7-10

6

8,31

15990

2665

4

10-13

4

10,9

11120

2780

5

13-16

3

14,4

9140

3047

Итого

30

6,87

76910

2564

Сравнивая гр. 4 и 6 таблицы 4, видим, что с увеличением стажа рабочих растет месячная выработка продукции. Следовательно, между изучаемыми признаками (показателями) имеется прямая зависимость.

Для полноты анализа можно отметить, что в данной совокупности рабочих больше во второй группе. Удельный вес рабочих в этой группе составляет 33,3%, выработка продукции этими рабочими составляет 32,9 %. Средняя выработка в этой группе на 32 руб. ниже, чем в среднем по всем рабочим.

С ростом стажа постепенно увеличивается прирост продукции. Рабочие пятой группы, наиболее квалифицированные, опытные произвели продукцию на 856 руб., или на 39,1 % больше по сравнению с рабочими первой группы. Следовательно, подтверждается вывод, сделанный ранее, что между изучаемыми признаками имеется прямая связь.

Задача 2 выполнена по теме «Вторичная группировка».

Пример решения задачи. Имеются следующие данные (табл. 5).

Таблица 5 - Группировка предприятий по количеству занятых

Количество занятых, тыс. чел.

Число предприятий

100 и менее

4

101—300

16

301—1000

35

1001—2000

28

2001—5000

12

5001 и более

5

Итого

100

Перегруппируйте предприятия по количеству занятых (от 200 и менее, 201—500, 501—1000, 1001—3000, 3001 и более).

Иногда возникает потребность в перегруппировке данных с целью сравнения структур двух группировок, выделения типов и т.п. Перегруппировка осуществляется путем или объединения, или расщепления интервалов первичной группировки. Результаты перегруппировки называют вторичной группировкой. Если границы интервалов первичной и вторичной группировок совпадают, частоты (частости) объединяющихся интервалов просто суммируются. В случае расщепления интервала первичной группировки частоты (частости) распределяются в той же пропорции, что и величина расщепленного интервала. Например, на основе первичной группировки предприятий региона по количеству занятых (т = 6) необходимо создать новые группы (m = 5) с другими интервалами. Техника перегруппировки показана в табл. 6.

Таблица 6 - Группировка предприятий по количеству занятых

Первичная группировка

Вторичная группировка

Количество занятых, тыс. чел.

Число предприятий

Количество занятых, тыс. чел.

Число предприятий

100 и менее

4

200 и менее

4 + 16∙(200 - 101)/(300 - 101) = 4 + +½∙16 = 12

101—300

16

201—500

16∙ (300 - 200)/(300 - 100) +

+35∙ (500 - 301)/(1000 - 301) = =½∙16+ 2/7∙35 = 18

301—1000

35

501—1000

35∙ (1000 - 500)/(1000 - 301) =

= 5/7∙35 = 25

1001—2000

28

1001—3000

28+12∙ (3000 - 2001)/(5000 - 2001) = = 28 + 1/3∙12 = 32

2001—5000

12

3001 и более

12∙ (5000 - 3000)/(5000 - 2001) + 5 = =2/3∙12 + 5 = 13

5001 и более

5

Итого

100

Итого

100

Задача 3 составлена по теме «Абсолютные и относительные величины».

Пример решения задачи. На основе данных рассчитать различные виды относительных показателей, характеризующих производство зерна в фермерских хозяйствах (табл. 7).

Таблица 7 - Производство зерна в фермерских хозяйствах

Периоды

Фермерское хозяйство 1

Фермерское хозяйство 2

посевная площадь, га

валовой сбор зерна, т

урожайность зерновых культур, ц с 1 га

всего

в т.ч зерновых

план

факт

Базисный

470

240

310

390

26

Отчетный

585

234

400

430

28

1. Относительный показатель планового задания:

Первое фермерское хозяйство запланировало увеличить валовой сбор зерна на 2,5 % по сравнению с фактически достигнутым уровнем базисного периода.

2. Относительный показатель выполнение плана:

План по производству зерна в первом фермерском хозяйстве перевыполнен на 7,5%.

3. Относительный показатель динамики рассчитывается как отношение любого показателя в отчетном периоде к аналогичному показателю в базисном периоде. Например:

Это значит, что у первого фермера валовой сбор зерна в отчетном периоде по сравнению с базисным увеличился на 10,2%.

4. Относительный показатель структуры:

т. е. зерновые в базисном периоде в первом фермерском хозяйстве занимали 51,06 % общей площади.

В отчетном периоде доля зерновых соответственно составляет 40,0%:

5. Относительный показатель интенсивности рассчитывается как отношение валового сбора зерновых к площади зерновых культур, т.е. получаем именованный показатель — урожайность зерновых культур, который имеет единицу измерения «центнеров с одного гектара».

У первого фермера она составила соответственно:

в базисный период

в отчетный период

6. Относительный показатель сравнения рассчитывается в данном случае как отношение урожайности в базисном или отчетном периоде у первого и второго фермеров.

В базисном периоде т. е. у второго фермера урожайность выше, чем у первого фермера на 59,5%.

В отчетном периоде превышение составило т.е. на 52,2 %.

Задачи 4…7 представлены по теме «Средние величины».

Пример решения задачи 4. Дневная выработка двух комбайнов на уборке озимой ржи характеризуется следующими данными (табл. 8).

Таблица 8 - Дневная выработка двух комбайнов

Дневная выработка, га

Дни работы

1

2

3

4

5

6

1-й комбайн

19

20

14

18

19

11

2-й комбайн

16

18

17

13

8

12

Определите среднюю выработку по каждому комбайну.

Для решения задачи воспользуемся средней арифметической простой:

(2)

Пример решения задачи 5. Распределение двух комбайнов по выработке на уборке озимой ржи представлено в таблице 9.

Таблица 9 - Распределение двух комбайнов по выработке

Дневная выработка, га

Количество дней работы за сезон

5

10

6

1-комбайн

14

24

30

2-комбайн

12

22

26

Определите среднюю сезонную выработку по двум комбайнам отдельно, а так же в целом.

Решение:

Для решения задачи воспользуемся средней арифметической взвешенной:

(3)

Среднюю сезонную выработку по второму комбайну и в целом определите самостоятельно.

Пример решения задачи 6. Имеются некоторые данные о реализации магазином партии продукции А по дням недели (табл. 10).

Таблица 10 - Данные о реализации магазином партии продукции А

Дни реализации

Исходные данные

Расчетные данные

Цена реализации, руб. за 1 кг

Общая выручка за 1 день, руб.

Объем реализованного картофеля, кг

Пятница

5,5

1265

230

Суббота

5,8

3683

635

Воскресенье

6,2

6119

987

Понедельник

5,4

997

185

Вторник

5,3

1078

203

Итого

Х

13142

2240

Определите среднюю цену реализации продукции А за 5 дней.

Для решения задачи воспользуемся средней гармонической взвешенной:

(4)

Пример решения задачи 7. Имеются следующие данные о месячной заработной плате рабочих (табл. 11).

Таблица 11 - Месячная заработная плата рабочих группы малых предприятий одного из регионов

Группы рабочих по размеру заработной платы, руб.

Число рабочих, чел

2000 – 3000

15

3000 – 4000

35

4000 – 5000

75

5000 – 6000

40

6000 – 7000

25

Свыше 7000

10

Итого

200

Исчислите среднюю заработную плату, моду и медиану заработной платы рабочих малых предприятий.

По условию задачи имеется интервальный ряд распределения рабочих, поэтому средняя заработная плата исчисляется по формуле средней арифметической взвешенной (сначала определим середину каждого интервала, т.е. ).

Следовательно, средняя месячная заработная плата рабочих малых предприятий составляет 4775 руб.

Далее исчислим моду по формуле:

(5)

где – нижняя граница модального интервала,

– величина модального интервала,

– частота модального интервала,

– частота интервала предшествующего модальному интервалу,

– частота интервала, следующего за модальным интервалом.

Таким образом, наиболее часто встречающаяся величина средней месячной заработной платы составляет 4533 руб.

Медиану определим по формуле:

(6)

где – нижняя граница медианного интервала,

– величина медианного интервала,

– сумма частот,

– накопление частот интервала, предшествующего медианному интервалу,

– частота медианного интервала.

Следовательно, половина рабочих имеет среднемесячную заработную плату меньше 4667 руб., а половина – больше этой суммы.

Задачи 8 и 9 направлены на изучение темы «Показатели вариации, дисперсионный анализ».

Пример решения задачи 8. Имеются выборочные данные о стаже работников коммерческих банков (табл. 12).

Таблица 12- Выборочные данные о стаже работников коммерческих банков

Стаж, лет

Среднесписочная численность работников, чел.

Середина интервала,

До 3

10

2

20

-3

9

90

3-5

48

4

192

-1

1

48

5-7

28

6

168

1

1

28

7-9

10

8

80

3

9

90

Свыше 9

4

10

40

5

25

100

Итого

100

-

500

-

356

Определить: 1) средний стаж работы, 2) дисперсию, 3) средние квадратическое отклонение, 4) коэффициент вариации.

1. Средний стаж работников составит:

2. Дисперсию определим по формуле:

3. Средние квадратическое отклонение:

4. Коэффициент вариации рассчитаем по формуле:

Анализ полученных данных говорит о том, что стаж работников коммерческих банков отличается от среднего стажа в среднем на 1,9 года, или на 37,7 %. Значение коэффициента вариации превышает 33%, следовательно, вариация производственного стажа велика, найденный средний производственный стаж плохо представляет всю совокупность работников, не является ее типичной, надежной характеристикой, а саму совокупность нет оснований считать однородной по производственному стажу.

Пример решения задачи 9. Определите наиболее эффективную систему оплаты труда рабочих по данным таблицы 13, используя правило сложения дисперсий.

Таблица 13 – Исходные данные

Сдельная система оплаты труда

Затраты времени на производимые операции, млн.

Число рабочих, чел.

Полное затраченное время, мин.

Затраты времени в среднем, мин.

Простая

28, 30, 29, 27, 31

5

145

29,0

Премиальная

23, 25, 24, 27, 24

5

123

24,6

Прогрессивная

18, 16, 19, 21, 20

5

94

18,8

Итого

15

362

24,13

Рассчитаем частные дисперсии по формуле:

(7)

Рассчитаем среднюю из частных дисперсий:

Определим межгрупповую дисперсию:

(8)

Определим общую дисперсию по формуле:

(9)

Сделаем проверку по правилу сложения дисперсий:

(10)

Так как, правило сложения дисперсий соблюдается, то по максимальной величине частной дисперсии можно считать, что наиболее эффективной системой оплаты труда по исследуемой совокупности является сдельная прогрессивная оплата труда.

Задача 10 представлена по теме «Выборочное наблюдение».

Пример решения задачи 10. Для определения расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням со стандартным отклонением 6 дней .

Необходимо с вероятностью определить предельную ошибку выборочной средней и доверительные пределы средней продолжительности расчетов предприятий данной корпорации.

Для вероятности находим

Предельную ошибку определим по формуле повторного отбора, так как численность генеральной совокупности неизвестна:

(11)

Предельную относительную ошибку выборки рассчитаем по формуле:

(12)

Генеральная средняя будет равна , а доверительные интервалы (пределы) генеральной средней рассчитаем по формуле исходя из двойного неравенства:

(13)

Тогда

Таким образом, с вероятностью 0,954 можно утверждать, что средняя продолжительность расчетов предприятий данной корпорации колеблется в пределах от 20,8 до 23,2 дня.

Задача 11 составлена по теме «Статистическое изучение динамики. Показатели анализа ряда динамики».

Пример решения задачи. Имеются данные о числе родившихся в Чувашской Республике за 2005-2010 гг., чел. (табл. 14).

Таблица 14 – Число родившихся

2005 г.

2006 г.

2007 г.

2008 г.

2009 г.

2010 г.

13133

13291

14835

14967

16103

16174

Определите аналитические показатели ряда динамики числа родившихся в Чувашской Республике за 2005 – 2010 гг.: 1) абсолютные приросты; 2) темпы роста; 3) темпы прироста; 4) абсолютное значение одного процента прироста, а также средние показатели (средний уровень ряда и средние показатели изменения уровней ряда). Сделайте прогноз на три предстоящих года по среднему абсолютному приросту и среднему темпу роста. Постройте график.

В зависимости от задачи исследования абсолютные приросты , темпы роста и темпы прироста могут быть исчислены с использованием постоянной базы сравнения (базисные) и переменной базы сравнения (цепные).

1. Абсолютный прирост - разность между последующим уровнем ряда и базисным (или предыдущим).

Абсолютный прирост базисный рассчитывается по формуле:

(14)

Так, и т.д.

Абсолютный прирост цепной рассчитывается по формуле:

(15)

Так, и т.д.

Таблица 15 - Динамика числа родившихся в Чувашской Республике

Годы

Число родившихся, чел.

Абсолютный прирост, чел.

Темпы роста, %

Темпы прироста, %

Абсолютное значение 1 % прироста, чел.

базисный

цепной

базисный

цепной

базисный

цепной

А

1

2

3

4

5

6

7

8

2005

13133

-

-

100

-

-

-

-

2006

13291

158

158

101,20

101,20

1,20

1,20

131,33

2007

14835

1702

1544

112,96

111,62

12,96

11,62

132,91

2008

14967

1834

132

113,97

100,89

13,97

0,89

148,35

2009

16103

2970

1136

122,62

107,59

22,62

7,59

149,67

2010

16174

3041

71

123,16

100,44

23,16

0,44

161,03

Следует отметить, что сумма цепных абсолютных приростов равна последнему базисному абсолютному приросту.

2. Темп роста - отношение уровней ряда динамики, которое выражается в коэффициентах и процентах.

Темп роста базисный определяется отношением каждого последующего уровня к базисному значению по формуле:

(16)

Так, и т.д.

Темп роста цепной определяется отношением последующего уровня к предыдущему по формуле:

(17)

Так, и т.д.

Между цепными и базисными темпами роста имеется взаимосвязь: произведение соответствующих цепных темпов роста равно базисному. Зная базисные темпы, можно исчислить цепные делением каждого последующего базисного темпа роста на каждый предыдущий.

3. Темп прироста определяют двумя способами:

а) темп прироста базисный - отношение абсолютного прироста базисного к базисному значению:

(18)

Так, и т.д.

Темп прироста цепной - отношение абсолютного прироста цепного к цепному значению:

(19)

Так, и т.д.

б) как разность между коэффициентом роста и единицей, если темпы роста выражены в коэффициентах:

(20)

или как разность между темпами роста и 100 %, если темпы роста выражены в процентах:

(21)

Так, и т.д.

и т.д.

4. Абсолютное значение одного процента прироста так же исчисляют двумя путями:

а) отношение абсолютного прироста цепного к темпу прироста цепного:

(22)

Так, и т.д.

б) как одна сотая часть предыдущего уровня:

(23)

Так, и т.д.

Средний уровень ряда рассчитаем по формуле:

чел.

Средний абсолютный прирост исчисляется двумя способами:

а) как средняя арифметическая простая годовых абсолютных (цепных) приростов

б) как отношение базисного абсолютного прироста к числу периодов

Средний темп роста исчисляется двумя способами:

а) как средняя геометрическая цепных коэффициентов роста по «цепному» способу

б) по «базисному» способу

Средний темп прироста определим по формуле:

(24)

или средний коэффициент роста:

(25)

Так,

Таким образом, ежегодно в Чувашской Республике увеличилось число родившихся на 608 человек, или на 4,25 %.

Составим прогноз числа родившихся в Чувашской Республике на предстоящие три года по среднему абсолютному приросту по формуле:

По среднему темпу роста прогнозные показатели определим по формуле:

Более наглядно этот прогноз изобразим на графике (рис. 1).

Рис. 1. Динамика и прогноз числа родившихся в Чувашской Республике

Таким образом, по нашим прогнозам в Чувашии будет наблюдаться рост рождаемости.

Задачи 12…14 составлены по теме «Методы анализа основных тенденций развития в рядах динамики, экстраполяция и прогнозирование».

Пример решения задачи 12. По данным табл. 16 выявите основную тенденцию методами скользящей (подвижной) средней и аналитического выравнивания по прямой. Результат экстраполяции прогноза добычи газа представьте в виде точечных оценок и определите вероятностные границы интервала. Постройте графики. Сделайте выводы.

Таблица 16 –Добыча естественного газа в Российской Федерации, млн. м3

Год

Добыча естественного газа, млн. м3

Год

Добыча естественного газа, млн. м3

1995

595467

2003

620234

1996

601472

2004

632623

1997

571062

2005

640801

1998

591400

2006

656271

1999

591641

2007

652740

2000

583933

2008

665525

2001

581443

2009

584477

2002

595106

Источник. Регионы России. Социально – экономические показатели. – 2003, 2009.

Расчет скользящей средней по данным добычи естественного газа приведен в табл. 17.

Таблица 17 – Исходные данные и результаты расчета скользящей средней

Год

Добыча естественного газа, млн. м3

Скользящая средняя

трехлетняя

пятилетняя

1995

595467

1996

601472

1997

571062

590208,4

1998

591400

584701

587901,6

1999

591641

588991,3

583895,8

2000

583933

585672,3

588704,6

2001

581443

586827,3

594471,4

2002

595106

598927,7

602667,8

2003

620234

615987,7

614041,4

2004

632623

631219,3

629007

2005

640801

643231,7

640533,8

2006

656271

649937,3

649592

2007

652740

658178,7

639962,8

2008

665525

634247,3

2009

584477

Таким образом, скользящие средние выявляют основную тенденцию добычи газа в РФ. Снижение производства газа в 2009 г. по всей видимости вызвано кризисом 2008-2009 гг.

Рис. 2. Добыча естественного газа в Российской Федерации

Рассмотрим метод аналитического выравнивания ряда динамики по прямой . Определим параметры и методом наименьших квадратов, решив систему нормальных уравнений:

(26)

где - фактические уровни ряда,

- время (порядковый номер периода или момента времени).

Упростим расчет параметров, взяв за начало отсчета времени (t=0) центральный интервал (момент).

Так как у нас для расчетов было взято 15 лет (нечетное число), то обозначим время t, используя ноль (табл. 18).

Таблица 18 - Расчетные данные для определения параметров системы нормальных уравнений и выровненных теоретических значений ( )

Годы

Добыча естественного газа, млн. м3

t

t

yt

1995

595467

-7

49

-4168269

540508,4

1996

601472

-6

36

-3608832

545004,5

1997

571062

-5

25

-2855310

549500,6

1998

591400

-4

16

-2365600

553996,7

1999

591641

-3

9

-1774923

558492,8

2000

583933

-2

4

-1167866

562989

2001

581443

-1

1

-581443

567485,1

2002

595106

0

0

0

571981,2

2003

620234

1

1

620234

576477,3

2004

632623

2

4

1265246

580973,4

2005

640801

3

9

1922403

585469,6

2006

656271

4

16

2625084

589965,7

2007

652740

5

25

3263700

594461,8

2008

665525

6

36

3993150

598957,9

2009

584477

7

49

4091339

603454

Итого

8579718

0

280

1258913

8579718

Так как , то система нормальных уравнений примет вид:

(27)

Тогда из первого и второго уравнений поочередно получим и

Получим уравнение прямой

Теперь подставив поочередно значения t из таблицы 3 в полученное уравнение, заполним последний столбец этой же таблицы (рис. 3).

, то есть задачу мы решили верно.

Рис. 3. Прогноз добычи полезных ископаемых

Теперь получим точечный прогноз, подставив в это уравнение значение t по возрастанию, так

млн. м3;

млн. м3;

млн. м3.

Параметры и можно вычислить иначе с помощью определителей по формулам:

(28)

(29)

Вспомогательные расчеты проведем в таблице 19, взяв величину t в порядке возрастания.

Таблица 19 – Расчет параметров и с помощью определителей

Годы

Добыча естественного газа, млн. м3

t

t

yt

1995

595467

1

1

595467

423613

1996

601472

2

4

1202944

444808,4

1997

571062

3

9

1713186

466003,9

1998

591400

4

16

2365600

487199,3

1999

591641

5

25

2958205

508394,8

2000

583933

6

36

3503598

529590,3

2001

581443

7

49

4070101

550785,7

2002

595106

8

64

4760848

571981,2

2003

620234

9

81

5582106

593176,6

2004

632623

10

100

6326230

614372,1

2005

640801

11

121

7048811

635567,6

2006

656271

12

144

7875252

656763

2007

652740

13

169

8485620

677958,5

2008

665525

14

196

9317350

699153,9

2009

584477

15

225

8767155

720349,4

Итого

8579718

120

1240

74572473

8579718

Подставим расчетные данные в формулы:

млн. м3;

млн. м3.

Отсюда получим линейное уравнение:

Параметры уравнения парной линейной регрессии можно рассчитать и по следующим формулам:

(30)

(31)

Подставив значения t по возрастанию, получим прогноз показателя на три года:

млн. м3;

млн. м3;

млн. м3.

Более наглядно изобразим на рис. 13.

Рассчитаем экстраполируемые прогнозные значения в виде интервальной оценки. Для этого воспользуемся формулой:

, (32)

то есть

(33)

где - коэффициент доверия по критерию Стьюдента;

- остаточное среднее квадратическое отклонение от тренда.

Рис. 4. Прогноз добычи полезных ископаемых

В таблице 20 приведем необходимые расчеты.

Таблица 20 – Вспомогательная таблица

Годы

Добыча естественного газа, млн. м3

1995

595467

423613

171854

29533797316

1996

601472

444808,4

156663,6

24543483565

1997

571062

466003,9

105058,1

11037204376

1998

591400

487199,3

104200,7

10857785880

1999

591641

508394,8

83246,2

6929929814

2000

583933

529590,3

54342,7

2953129043

2001

581443

550785,7

30657,3

939870043,3

2002

595106

571981,2

23124,8

534756375

2003

620234

593176,6

27057,4

732102894,8

2004

632623

614372,1

18250,9

333095350,8

2005

640801

635567,6

5233,4

27388475,56

2006

656271

656763

-492

242064

2007

652740

677958,5

-25218,5

635972742,3

2008

665525

699153,9

-33628,9

1130902915

2009

584477

720349,4

-135872,4

18461309082

Итого

8579718

-

-

108650969937,47

Остаточное среднее квадратическое отклонение от тренда рассчитаем по формуле:

где - число уровней ряда динамики;

- число параметров адекватной модели тренда.

Согласно таблице Стьюдента (приложение 2) при уровне значимости коэффициент доверия составляет 2,1604.

Согласно точечной оценке прогнозного значения добыча естественного газа в 2010 г. составит 607950,16 млн. м3. Тогда вероятностные границы интервала будут в пределах

Вероятностные границы на 2011 г. и 2012 г. рассчитайте самостоятельно.

Пример решения задачи 13. По данным табл. 21 выявите основную тенденцию методом аналитического выравнивания по прямой по формулам и с помощью статистическо функции ЛИНЕЙН, а экспоненциальный тренд рассчитайте, используя функцию ЛГРФПРИБЛ.

Согласно условию задачи число уровней четное число равное 6, поэтому условное обозначение времени будет как бы в полугодиях.

Таблица 21 - Расчетные данные для определения параметров системы нормальных уравнений и выровненных теоретических значений ( )

Годы

Посевные площади всех сельскохозяйственных культур, тыс. га

t

t

yt

2005

551,3

-5

25

-2757

546,03

2006

549,1

-3

9

-1647

553,59

2007

549,9

-1

1

-549,9

561,15

2008

571,7

+1

1

571,7

568,71

2009

595,7

+3

9

1787,1

576,27

2010

571,9

+5

25

2859,5

583,83

Итого

3389,6

0

70

264,6

3389,6

2011

+7

591,39

2012

+9

598,95

2013

+11

606,51

Источник. Сельское хозяйство, охота и охотное хозяйство, лесоводство в России. 2011. Стат. сб. /Росстат – М., 2011. –С. 220.

Так как , то и

Получим уравнение прямой

Теперь подставив поочередно значения t из таблицы 3 в полученное уравнение, заполним последний столбец этой же таблицы.

, то есть задачу мы решили верно.

Теперь получим точечный прогноз, подставив в это уравнение значение t по возрастанию, так

тыс. га;

тыс. га;

тыс. га;

Более наглядно изобразим на рис. 5.

Рис. 5. Прогноз посевных площадей сельскохозяйственных культур ЧР

Приведем пример использования статистической функции ЛИНЕЙН в MS Excel (Windows 7):

1) введем первичные данные, приняв за независимую переменную время (t), а у – площади сельскохозяйственных культур;

2) выделим пустые ячейки, взяв два столбца и пять строк (D2:D7; E2:E7);

3) в главном меню выбираем Формулы. Нажимаем на кнопку Вставить функцию. Открывается диалоговое окно Мастер функций, выбираем в окне «Категория» - Статистические, «Функция» - ЛИНЕЙН. Кликаем на ОК.

Рис. 6. Диалоговое окно «Мастер функций»

4) заполняем диалоговое окно «Аргументы функции» аналогично рис. 7.

Рис. 7. Диалоговое окно «Аргументы функций»

5) нажимаете последовательно на ОК, клавишу F2, <CTRL> + <SHIFT> + <ENTER>. В результате получаем следующие значения (рис. 8).

Рис. 8. Регрессионная статистика функции ЛИНЕЙН

Мы получили следующую функцию Среднее квадратическое отклонение равно 5,41, - 1,58, - 13,26. Коэффициент детерминации составил 0,59, число степеней свободы – 4, F – статистика – 5,69, остаточная сумма квадратов – 703,29, регрессионная сумма квадратов – 1000,19.

Экспоненциальный тренд (функция ЛГРФПРИБЛ) рассчитывается аналогично (рис. 9).

Рис. 9. Регрессионная статистика функции ЛГРФПРИБЛ

Мы получили следующую функцию Среднее квадратическое отклонение равно 0,02, - 0,006, - 0,023. Коэффициент детерминации составил 0,59, число степеней свободы – 4, F – статистика – 5,86, остаточная сумма квадратов – 0,002, регрессионная сумма квадратов – 0,003.

Пример решения задачи 14. По данным табл. 21 в MS Excel постройте графики и спрогнозируйте посевные площади всех сельскохозяйственных культур Чувашской Республики построив 1) линейную, 2) экспоненциальную, 3) логарифмическую, 4) полиноминальную, 5) степенную линии тренда, указав на ней функцию и коэффициент апроксимации. Определите линию тренда, наиболее полно отражающую исследуемую совокупность.

Решение: в MS Excel (Windows 7) построим диаграммы по следующей схеме:

1) выделим посевную площадь,

2) в главном меню выбираем Вставка /График. Следует обратить внимание, что во время выполнения следующих операций вы должны постоянно кликать на график,

3) находим Конструктор /Макеты диаграмм и нажимаем на нужный макет (в нашем примере первый по счету),

4) в главном меню выбираем Макет /Названия осей /Название основной горизонтальной оси /Название под осью. Заполняем названия осей («Посевная площадь, га» и «Годы»),

5) находим Конструктор /Выбрать данные и выходит диалоговое окно «Выбор источника данных». Кликаем мышкой на «Ряд 1», затем на «Изменить» с левой стороны,

Рис. 10. Диалоговое окно «Выбор источника данных»

Рис. 11. Диалоговое окно «Изменение ряда»

Заполняем Имя ряда и нажимаем дважды на ОК.

6) находим Конструктор /Выбрать данные и выходит диалоговое окно «Выбор источника данных». Кликаем мышкой на «Изменить» уже с правой стороны. Выходит новое диалоговое окно «Подписи оси» и заполняем его. Затем вновь нажимаем дважды на ОК,

Рис. 12. Диалоговое окно «Подписи оси»

7) выбираем Макет /Линия тренда /Линейное приближение. На графике появляется линия тренда. Дважды кликаем на нее и выходит диалоговое окно «Формат линии тренда».

Рис. 13. Диалоговое окно «Формат линии тренда»

Отмечаем прогноз на три года и ставим две галочки внизу. Кликаем на «Закрыть».

Более наглядно полученный график представлен на рис. 23.

Рис. 14. Линейная линия тренда

Как видно из рис. 14 линейная функция имеет вид

По аналогичной схеме построим остальные графики. Как только вы поняли, что можете строить их без подсказки, можете облегчить себе работу следующим образом. Скопировать предыдущий график, кликнуть дважды на линии тренда и менять ее параметры.

Рис. 15. Экспоненциальная линия тренда

Рис. 16. Логарифмическая линия тренда

Рис. 17. Полиноминальная линия тренда

Рис. 18. Степенная линия тренда

Внимательно сравнив графики по максимальному значению определяем, что наиболее полно исследуемую совокупность отражает экспоненциальная линия тренда.

Задачи 15 и 16 составлены по теме «Индексы. Анализ индексным методом».

Задача 15. На основе данных о продаже товаров (табл. 22) определите: 1) индивидуальные индексы объемов продаж в натуральном выражении, цен и товарооборота; 2) агрегатные индексы физического объема; 3) агрегатные индексы цен по формулам Пааше и Ласпейреса; 4) общий индекс товарооборота; 5) абсолютные приросты товарооборота за счет изменения объемов продаж, цен за счет совместного действия обоих факторов. Показать взаимосвязь между общими индексами и между абсолютными приростами товарооборота.

Таблица 22 – Исходные данные

Товары

Единица измерения

Количество

Цена, руб.

Базисный период

Отчетный период

Базисный период

Отчетный период

Картофель

кг

1000

750

13

15

Молоко

л

2000

1800

30

32

Решение: 1. По картофелю:

или 75 %.

или 115,38 %.

или 86,54 %.

По молоку:

или 90 %.

или 106,67 %.

или 96 %.

2. или 87,33 %.

То есть количество проданных товаров по двум видам в среднем снизилось на 12,67 %.

3. а) по формуле Пааше:

или 108 %.

То есть средний прирост цен на все товары составил 8 %.

б) по формуле Ласпейреса:

или 108,22 %.

То есть, если бы население приобрело товаров в отчетном периоде столько же, сколько и в базисном, то цены в среднем увеличились бы на 8,22 %.

4. или 94,32 %.

То есть товарооборот по двум товарам уменьшился на 5,68 %.

5. тыс. руб.

То есть за счет снижения среднего количества реализованных товаров выручка от продажи снизилась на 9250 тыс. руб.

по методике Пааше

тыс. руб.

Таким образом, за счет изменения среднего роста цен денежная выручка продавцов увеличилась на 5100 тыс. руб.;

по методике Ласпейреса

тыс. руб.

То есть, если население в отчетном периоде купило бы столько же товаров, что и в базисном, то в результате среднего роста цен население бы выиграло 6000 тыс. руб.;

тыс. руб.

То есть товарооборот по всем товарам сократился на 4150 тыс. руб.

Взаимосвязь (действует при условии, что индекс найден по методике Пааше) между индексами:

;

между абсолютными приростами товарооборота:

тыс. руб.

Задача 16. Имеются следующие данные о выпуске продукции «А» по двум заводам (табл. 23).

Таблица 23 – Исходные данные

№ завода

Базисный год

Отчетный год

Произведено продукции, тыс. шт.

Себестоимость единицы, руб.

Удельный вес продукции, %

Произведено продукции, тыс. шт.

Себестоимость единицы, руб.

Удельный вес продукции, %

1

60

24

50

80

20

40

2

60

20

50

120

18

60

120

100

200

100

Вычислить:

  1. Индекс себестоимости переменного состава;

  2. Индекс себестоимости постоянного состава;

  3. Индекс структурных сдвигов

Решение: 1. Вычислим индекс себестоимости переменного состава:

или 85,45 %.

Таким образом, средняя себестоимость снизилась на 14,55 %.

2. Индекс себестоимости постоянного состава:

или 87,04 %.

Себестоимость продукции по двум заводам в среднем снизилась на 12,96 %.

3. Индекс структурных сдвигов равен:

или 98,2 %, т.е. себестоимость изделия в отчетном периоде снизилась дополнительно на 1,8 % за счет изменения структуры.

Исчисленные выше индексы можно вычислить по удельным весам продукции заводов, выраженных в коэффициентах:

а) индекс себестоимости переменного состава:

б) индекс себестоимости постоянного состава:

в) индекс структурных сдвигов:

Задачи 17…20 составлены по теме «Статистические методы изучения взаимосвязей».

Пример решения задачи 17. Охарактеризуйте зависимость урожайности зерновых от качества почвы (табл. 24), рассчитав параметры нижеследующих функций: а) линейной, б) степенной, в) экспоненты, г) показательной, д) равносторонней гиперболы, е) обратной и т.д. Определите показатели тесноты связи для каждой модели, оценив каждую из них по показателю детерминации, F-критерию Фишера, ошибку апроксимации и выбрать наилучшую из них. Для расчетов используйте программы Statgraphics, статистические функции ЛИНЕЙН, ЛГРФПРИБЛ в MS Excel, инструмент анализа данных Регрессия и т.д.

Решение: для определения формы связи между урожайностью зерновых культур и качеством почвы построим график (рис. 19). На оси абсцисс нанесем значение независимой переменной (качество почвы), на оси ординат - зависимой (урожайность).

Рис. 19. Зависимость урожайности от качества почвы

а) рассмотрим линейную функцию, выраженную уравнением прямой линии:

(34)

где - урожайность зерновых, ц/га;

- качество почвы, бал.;

- параметры уравнения связи, которые следует определить на основе решения системы нормальных уравнений с двумя неизвестными:

(35)

Для удобства расчетов заполним таблицу 24.

Таблица 24 - Данные для уравнения связи и коэффициента корреляции

№ хозяйства

Урожайность зерновых, ц/га

Качество почвы, балл

Расчетные данные

Ожидаемое значение урожайности в зависимости от качества почвы

1

17,3

40

299,29

1600

692

17,7944

-0,2737

1,582081

2

17,9

42

320,41

1764

751,8

18,0862

-0,2191

1,224022

3

21,2

45

449,44

2025

954

18,5239

2,5355

11,95991

4

20,5

48

420,25

2304

984

18,9616

1,2901

6,293171

5

21,2

48

449,44

2304

1017,6

18,9616

1,4447

6,814623

6

18,6

61

345,96

3721

1134,6

20,8583

-1,7007

9,143548

7

19,5

65

380,25

4225

1267,5

21,4419

-1,3461

6,903077

8

19,8

66

392,04

4356

1306,8

21,5878

-1,5915

8,037879

9

24

74

576

5476

1776

22,755

2,0631

8,59625

10

21,2

75

449,44

5625

1590

22,9009

-1,2823

6,048585

11

19,5

79

380,25

6241

1540,5

23,4845

-3,5277

18,09077

12

28

84

784

7056

2352

24,214

4,4269

15,81036

13

22,5

85

506,25

7225

1912,5

24,3599

-1,6185

7,193333

14

24

86

576

7396

2064

24,5058

-0,6639

2,76625

15

24,5

87

600,25

7569

2131,5

24,6517

-0,7093

2,895102

16

22,5

95

506,25

9025

2137,5

25,8189

-3,2547

14,46533

17

24,3

100

590,49

10000

2430

26,5484

-2,0001

8,230864

18

30,5

100

930,25

10000

3050

26,5484

3,6545

11,98197

19

28,5

100

812,25

10000

2850

26,5484

1,1091

3,891579

20

29,6

100

876,16

10000

2960

26,5484

1,6637

5,620608

Итого

455,1

1480

10644,67

117912

34902,3

455,1

2,1316E-14

157,5493

Данные таблицы 259 занесем в систему уравнения.

Разделив оба уравнения на коэффициент при , т.е. первое на 20, второе - на 1543, получим:

Вычтем из большего уравнения меньшее, в данном случае из второго первое:

.

Решим задачу методом определителей: определитель системы равен:

Уравнение регрессии составит:

Используя статистическую функцию ЛИНЕЙН в MS Excel (Windows 7) получим следующее решение (рис. 20).

Рис. 20. Регрессионная статистика функции ЛИНЕЙН

Мы получили следующую функцию Коэффициент детерминации составил 0,62.

Коэффициент регрессии (параметр ), равный 0,1459, показывает, что с увеличением балла почвы на единицу урожайность в данных конкретных условиях возрастает на 0,1459 ц/га.

Определим тесноту связи между изучаемыми признаками, для чего рассчитаем коэффициент корреляции по формулам:

. (36)

(37)

Для определения коэффициента корреляции надо определить средние значения , , а также средние квадратические отклонения по результативному и факторному признакам. Все исходные и расчетные данные имеются в таблице 259.

,

, ,

Коэффициент парной линейной корреляции можно рассчитать и по другой формуле, если известен коэффициент регрессии:

Рассчитанный коэффициент корреляции показал существенную зависимость урожайности зерновых от качества почв. Коэффициент детерминации показывает, что на 25 % урожайность в данных условиях зависит от качества почвы, а на 75 % - от других факторов, которые не рассматривались в задаче.

Рассчитаем F-критерий Фишера по формуле:

Если возьмем коэффициент детерминации по данным рис. 30, то получим следующий F-критерий Фишера:

Этот расчет совпадает с рис. 30.

Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Определим среднюю ошибку апроксимации по формуле:

Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико.

Решим эту задачи с помощью программы Statgraphics:

  1. Откроем таблицу данных и введем значения;

  2. В главном меню выберем Ralate/ Simple Regression;

  3. Заполним поля у и х, нажмем на OK три раза (рис. 21…23) и получаем результат (рис. 24).

Рис. 21. Диалоговое окно Simple Regression

Рис. 22. Диалоговое окно Simple Regression Options

Рис. 23. Диалоговое окно Tables and Graphs

Рис. 24. Результаты расчетов

Определим эмпирическое корреляционное отношение по формуле:

или 78,68.

Определим теоретическое корреляционное отношение по формуле:

Таким образом, мы получили те же значения и уравнение регрессии составило: Из рисунка 34 видно, что случайные ошибки параметров и равны и . Эти значения указывают на величину, сформировавшуюся под воздействием случайных факторов. На их основе рассчитываются значения t-критерия Стьюдента: и . На основе Приложения 2 определим критические значения t-критерия Стьюдента для уровня значимости , т.е. с вероятностью 0,95 составит 2,1098, , т.е. с вероятностью 0,99 – 2,8982. Так как фактические значения больше теоретических (критических), то делаем вывод о существенности данных параметров ( и ), которые формируются под воздействием не случайных причин. Об это же свидетельствует показатель вероятности случайных значений параметров регрессии, так То есть вероятность случайно получить такое значение t-критерия Стьюдента составляет 0,0000, что не превышает допустимый уровень значимости 5 %.

Чуть ниже на рис. 34 представлен расчет F-критерий Фишера, и он составляет 29,23. Согласно дисперсионному анализу вероятность получить случайно такое значение F-критерий Фишера составляет 0,0000, что не превышает допустимый уровень значимости 5%.

Отсюда же берем нескорректированный коэффициент детерминации , который оценивает долю вариации результата в зависимости от факторов в общей вариации. Этот показатель показывает на достаточно высокую связь результата и от факторного признака. Скорректированный коэффициент детерминации оценивает тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и поэтому может сравниваться по разным моделям с разным числом факторов.

Помощью инструмента анализа данных Регрессия получим следующие данные (рис. 25).

Рис. 25. Регрессионная статистика

Как видим из рис. 25 уравнение регрессии полностью совпадает.

б) рассмотрим степенную функцию:

(38)

Линеаризуем модель логарифмированием:

Пусть , ,

Тогда получим линейное уравнение: .

Для удобства расчетов заполним таблицу 25.

Таблица 25 - Данные для уравнения связи и индекса корреляции

№ хозяйства

1

2,850707

3,688879

10,51591

8,126528

13,60783

2,879097

17,7982

0,248206

29,75703

2

2,884801

3,73767

10,78243

8,322075

13,97017

2,898926

18,15464

0,064843

23,57103

3

3,054001

3,806662

11,62555

9,326923

14,49068

2,926966

18,67089

6,39639

2,418025

4

3,020425

3,871201

11,69267

9,122966

14,9862

2,953195

19,16709

1,776646

5,085025

5

3,054001

3,871201

11,82265

9,326923

14,9862

2,953195

19,16709

4,132719

2,418025

6

2,923162

4,110874

12,01675

8,544874

16,89928

3,0506

21,12802

6,390899

17,26403

7

2,970414

4,174387

12,39966

8,823362

17,42551

3,076413

21,68049

4,754532

10,59503

8

2,985682

4,189655

12,50898

8,914297

17,55321

3,082618

21,81543

4,061964

8,732025

9

3,178054

4,304065

13,67855

10,10003

18,52498

3,129115

22,85375

1,313896

1,550025

10

3,054001

4,317488

13,18561

9,326923

18,6407

3,13457

22,97876

3,16399

2,418025

11

2,970414

4,369448

12,97907

8,823362

19,09207

3,155687

23,46916

15,75425

10,59503

12

3,332205

4,430817

14,76439

11,10359

19,63214

3,180628

24,06187

15,5089

27,51003

13

3,113515

4,442651

13,83226

9,693978

19,73715

3,185438

24,17787

2,81526

0,065025

14

3,178054

4,454347

14,15616

10,10003

19,84121

3,190191

24,29307

0,085892

1,550025

15

3,198673

4,465908

14,28498

10,23151

19,94434

3,19489

24,40748

0,00856

3,045025

16

3,113515

4,553877

14,17857

9,693978

20,73779

3,230641

25,29587

7,816884

0,065025

17

3,190476

4,60517

14,69269

10,17914

21,20759

3,251487

25,82872

2,336998

2,387025

18

3,417727

4,60517

15,73921

11,68086

21,20759

3,251487

25,82872

21,82082

59,98503

19

3,349904

4,60517

15,42688

11,22186

21,20759

3,251487

25,82872

7,135714

33,00503

20

3,387774

4,60517

15,60128

11,47702

21,20759

3,251487

25,82872

14,22252

46,85403

Итого

62,22751

85,20981

265,8842

194,1402

364,8998

62,22812

452,4346

119,8099

288,8695

В среднем

3,111375

4,260491

13,29421

9,70701

18,24499

2,879097

17,7982

29,75703

Получим систему нормальных уравнений:

Коэффициент эластичности 0,4064 показывает, что с ростом качества почвы на 1 балл, урожайность зерновых возрастает на 0,41 ц/га.

Если решить эту систему через статистическую функцию ЛИНЕЙН в MS Excel получим следующее уравнение

Решим эту задачу с помощью программы Statgraphics (рис. 26).

Рис. 26. Результаты расчетов

Получаем уравнение регрессии Из рисунка 36 видно, что случайные ошибки параметров и равны и . Эти значения указывают на величину, сформировавшуюся под воздействием случайных факторов. На их основе рассчитываются значения t-критерия Стьюдента: и . На основе Приложения 2 определим критические значения t-критерия Стьюдента для уровня значимости , т.е. с вероятностью 0,95 составит 2,1098, , т.е. с вероятностью 0,99 – 2,8982. Так как фактические значения больше теоретических (критических), то делаем вывод о существенности данных параметров ( и ), которые формируются под воздействием не случайных причин. Об это же свидетельствует показатель вероятности случайных значений параметров регрессии, так То есть вероятность случайно получить такое значение t-критерия Стьюдента составляет 0,0000, что не превышает допустимый уровень значимости 5 %.

Тесноту связи определим, рассчитав индекс корреляции:

Коэффициент детерминации составил 0,5852, таким образом, на 58,52% вариации объясняется вариацией , на долю прочих факторов приходится 23,5 %.

Рассчитаем F-критерий Фишера по формуле:

Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Чуть ниже (рис. 36) представлен расчет F-критерий Фишера, и он составляет 26,43. Согласно дисперсионному анализу вероятность получить случайно такое значение F-критерий Фишера составляет 0,0001, что не превышает допустимый уровень значимости 5%.

Определим среднюю ошибку апроксимации по формуле:

Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико.

в) рассмотрим функцию экспоненты:

(39)

Для оценки параметров приведем уравнение к линейному виду:

Воспользуемся методом наименьших квадратов и получим систему уравнений:

Для удобства расчетов заполним таблицу 26.

Таблица 26 - Данные для уравнения связи и индекса корреляции

№ хозяйства

1

0,0578

40

2,3121

1600

114,0283

18,0970

0,6352

29,757

0,0461

2

0,0559

42

2,3464

1764

121,1616

18,3279

0,1831

23,571

0,0239

3

0,0472

45

2,1226

2025

137,4301

18,67984

6,3512

2,4180

0,1189

4

0,0488

48

2,3415

2304

144,9804

19,03853

2,1360

5,0850

0,0713

5

0,0472

48

2,2642

2304

146,5921

19,03853

4,6720

2,4180

0,1020

6

0,0538

61

3,2796

3721

178,3129

20,67416

4,302147

17,2640

0,1115

7

0,0513

65

3,3333

4225

193,0769

21,20516

2,90762

10,5950

0,0874

8

0,0505

66

3,3333

4356

197,055

21,34003

2,3717

8,7320

0,0778

9

0,0417

74

3,0833

5476

235,176

22,45032

2,4015

1,5500

0,0646

10

0,0472

75

3,5378

5625

229,0501

22,5931

1,9407

2,4180

0,0657

11

0,0513

79

4,0513

6241

234,6627

23,1734

13,4938

10,5950

0,1884

12

0,0357

84

3

7056

279,9052

23,9198

16,6484

27,5100

0,1457

13

0,0444

85

3,7778

7225

264,6488

24,0719

2,4708

0,0650

0,0699

14

0,0417

86

3,5833

7396

273,3126

24,2250

0,0506

1,5500

0,0094

15

0,0408

87

3,5510

7569

278,2846

24,3791

0,0146

3,0450

0,0049

16

0,0444

95

4,2222

9025

295,784

25,6475

9,9065

0,0650

0,1399

17

0,0413

100

4,1152

10000

319,0476

26,4735

4,7242

2,3870

0,0894

18

0,0328

100

3,2787

10000

341,7727

26,4735

16,2126

59,9850

0,1320

19

0,0351

100

3,5088

10000

334,9904

26,4735

4,1067

33,0050

0,0711

20

0,0338

100

3,3784

10000

338,7774

26,4735

9,7749

46,8540

0,1056

Итого

0,9024

1480

64,4208

117912

4658,049

452,7551

105,3042

288,8695

1,7255

Получим систему нормальных уравнений:

Сделаем потенцирование

.

Тесноту связи определим, рассчитав индекс корреляции:

Коэффициент детерминации составил 0,6365, таким образом, на 63,65 % вариации объясняется вариацией , на долю прочих факторов приходится 36,47 %.

Рассчитаем F-критерий Фишера по формуле:

Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Определим среднюю ошибку апроксимации по формуле:

Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико.

Решим эту задачу с помощью программы Statgraphics (рис. 27).

Таким образом, мы получили те же значения и уравнение регрессии . Из рисунка 37 видно, что случайные ошибки параметров и равны и . На их основе рассчитываются значения t-критерия Стьюдента: и . На основе Приложения 2 определим критические значения t-критерия Стьюдента для уровня значимости , т.е. с вероятностью 0,95 составит 2,1098, , т.е. с вероятностью 0,99 – 2,8982. Так как фактические значения больше теоретических (критических), то делаем вывод о существенности данных параметров ( и ), которые формируются под воздействием не случайных причин. Об это же свидетельствует показатель вероятности случайных значений параметров регрессии, так То есть вероятность случайно получить такое значение t-критерия Стьюдента составляет 0,0000, что не превышает допустимый уровень значимости 5 %.

Рис. 27. Результаты расчетов

Чуть ниже на рис. 28 представлен расчет F-критерий Фишера, и он составляет 32,03. Согласно дисперсионному анализу вероятность получить случайно такое значение F-критерий Фишера составляет 0,0000, что не превышает допустимый уровень значимости 5%.

г) рассмотрим функцию показательной кривой:

(40)

Для оценки параметров приведем уравнение к линейному виду:

Воспользуемся методом наименьших квадратов и получим систему уравнений:

Получим систему нормальных уравнений:

Получаем уравнение регрессии:

Сделаем потенцирование и получим

; ; , , получаем

.

Тесноту связи определим, рассчитав индекс корреляции:

Коэффициент детерминации составил 0,6282, таким образом, на 62,82% вариации объясняется вариацией , на долю прочих факторов приходится 37,18 %.

Рассчитаем F-критерий Фишера по формуле:

Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Определим среднюю ошибку апроксимации по формуле:

Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико.

Эту задачу решим с помощью статистической функции ЛГРФПРИБЛ (рис. 28).

Рис. 28. Решение статистической функции ЛГРФПРИБЛ

Таким образом, мы получаем уравнение регрессии .

д) рассмотрим функцию равносторонней гиперболы:

. (41)

Для оценки параметров приведем уравнение к линейному виду при . Затем получим

Воспользуемся методом наименьших квадратов и получим систему уравнений:

Таблица 27 - Данные для уравнения связи и коэффициента корреляции

№ хозяйства

1

17,3

0,025

0,4325

0,000625

17,39276

0,00860349

-0,53616

2

17,9

0,0238095

0,42619

0,000567

18,0186

0,01406483

-0,66254

3

21,2

0,0222222

0,47111

0,000494

18,85305

5,508179518

11,07052

4

20,5

0,0208333

0,42708

0,000434

19,5832

0,84052988

4,472215

5

21,2

0,0208333

0,44167

0,000434

19,5832

2,614055713

7,626435

6

18,6

0,0163934

0,30492

0,000269

21,91727

11,00429439

-17,8348

7

19,5

0,0153846

0,3

0,000237

22,44762

8,688454595

-15,116

8

19,8

0,0151515

0,3

0,00023

22,57016

7,673789783

-13,9907

9

24

0,0135135

0,32432

0,000183

23,43127

0,32345658

2,369718

10

21,2

0,0133333

0,28267

0,000178

23,52599

5,410226379

-10,9716

11

19,5

0,0126582

0,24684

0,00016

23,8809

19,19225154

-22,4661

12

28

0,0119048

0,33333

0,000142

24,277

13,86074673

13,29644

13

22,5

0,0117647

0,26471

0,000138

24,35063

3,424816156

-8,225

14

24

0,0116279

0,27907

0,000135

24,42254

0,178541624

-1,76059

15

24,5

0,0114943

0,28161

0,000132

24,4928

5,17738E-05

0,029369

16

22,5

0,0105263

0,23684

0,000111

25,00165

6,258276422

-11,1185

17

24,3

0,01

0,243

0,0001

25,27834

0,957153069

-4,0261

18

30,5

0,01

0,305

0,0001

25,27834

27,26571227

17,12019

19

28,5

0,01

0,285

0,0001

25,27834

10,37908027

11,30406

20

29,6

0,01

0,296

0,0001

25,27834

18,67672787

14,6002

Итого

455,1

0,296451

6,48186

0,004868

454,862

142,2790129

-24,819

Получим систему нормальных уравнений:

Получаем уравнение регрессии:

Решим эту задачу с помощью программы Statgraphics (рис. 29).

Тесноту связи определим, рассчитав индекс корреляции:

Коэффициент детерминации составил 0,5075, таким образом, на 50,75% вариации объясняется вариацией , на долю прочих факторов приходится 49,25 %.

Рассчитаем F-критерий Фишера по формуле:

Рис. 29. Результаты расчетов

Таким образом, мы получили те же значения. Небольшие различия объясняются округлением.

Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Определим среднюю ошибку апроксимации по формуле:

Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико.

е) рассмотрим обратную функцию:

. (42)

Для оценки параметров приведем уравнение к линейному виду при . Затем получим

Воспользуемся методом наименьших квадратов и получим систему уравнений:

Таблица 28 - Данные для уравнения связи и коэффициента корреляции

№ хозяйства

1

0,0578035

40

2,3121387

1600

19,2678227

3,8723263

11,3747

2

0,0558659

42

2,3463687

1764

19,4174757

2,3027326

8,477518

3

0,0471698

45

2,1226415

2025

19,6463654

2,4137804

7,328465

4

0,0487805

48

2,3414634

2304

19,8807157

0,383513

3,020899

5

0,0471698

48

2,2641509

2304

19,8807157

1,740511

6,223039

6

0,0537634

61

3,2795699

3721

20,9643606

5,590201

12,71162

7

0,0512821

65

3,3333333

4225

21,3219616

3,3195441

9,343393

8

0,0505051

66

3,3333333

4356

21,4132762

2,6026602

8,14786

9

0,0416667

74

3,0833333

5476

22,172949

3,3381153

7,612712

10

0,0471698

75

3,5377358

5625

22,2717149

1,1485729

5,055259

11

0,0512821

79

4,0512821

6241

22,675737

10,085305

16,28583

12

0,0357143

84

3

7056

23,2018561

23,022184

17,13623

13

0,0444444

85

3,7777778

7225

23,3100233

0,6561378

3,600104

14

0,0416667

86

3,5833333

7396

23,4192037

0,3373243

2,419984

15

0,0408163

87

3,5510204

7569

23,5294118

0,9420415

3,961585

16

0,0444444

95

4,2222222

9025

24,4498778

3,8020232

8,666123

17

0,0411523

100

4,1152263

10000

25,0626566

0,5816452

3,138505

18

0,0327869

100

3,2786885

10000

25,0626566

29,564703

17,82736

19

0,0350877

100

3,5087719

10000

25,0626566

11,815329

12,06085

20

0,0337838

100

3,3783784

10000

25,0626566

20,587485

15,32886

Итого

0,9023554

1480

64,42077

117912

447,074094

128,10614

179,7209

Получим систему нормальных уравнений:

Получаем уравнение регрессии:

Решим эту задачу с помощью программы Statgraphics (рис. 30).

Таким образом, мы получили те же значения. Небольшие различия объясняются округлением.

Тесноту связи определим, рассчитав индекс корреляции:

Коэффициент детерминации составил 0,5565, таким образом, на 55,65% вариации объясняется вариацией , на долю прочих факторов приходится 44,35 %.

Рассчитаем F-критерий Фишера по формуле:

Рис. 30. Результаты расчетов

Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Определим среднюю ошибку апроксимации по формуле:

Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико.

ж) рассмотрим функцию:

. (43)

Воспользуемся программой Statgraphics (рис. 31) и получим уравнение регрессии: .

Таблица 29 - Данные для расчета коэффициентов

№ хозяйства

1

17,3

40

17,309697

9,40261E-05

0,056050315

2

17,9

42

17,70052

0,039792138

1,114411557

3

21,2

45

18,271088

8,578526578

13,81562351

4

20,5

48

18,824369

2,807738202

8,173808233

5

21,2

48

18,824369

5,643621165

11,20580513

6

18,6

61

21,054577

6,02494794

13,1966502

7

19,5

65

21,694719

4,81679326

11,2549713

8

19,8

66

21,851825

4,209986222

10,36275301

9

24

74

23,070187

0,86455174

3,874219769

10

21,2

75

23,217988

4,072274111

9,518809617

11

19,5

79

23,800012

18,4901066

22,05134562

12

28

84

24,508114

12,19326952

12,47102229

13

22,5

85

24,647293

4,610867034

9,543524244

14

24

86

24,785691

0,617309766

3,273710958

15

24,5

87

24,92332

0,179199656

1,72783593

16

22,5

95

25,998137

12,2369655

15,54727748

17

24,3

100

26,647893

5,512601421

9,662111008

18

30,5

100

26,647893

14,83872853

12,6298591

19

28,5

100

26,647893

3,430300433

6,498621141

20

29,6

100

26,647893

8,714935888

9,973334544

Итого

455,1

1480

457,07348

117,8826097

185,9517449

Решим эту задачу с помощью программы Statgraphics (рис. 31):

Рис. 31. Результаты расчетов

Тесноту связи определим, рассчитав индекс корреляции:

Коэффициент детерминации составил 0,5919, таким образом, на 59,19% вариации объясняется вариацией , на долю прочих факторов приходится 40,81 %.

Рассчитаем F-критерий Фишера по формуле:

Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Определим среднюю ошибку апроксимации по формуле:

Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико.

Теперь необходимо определить наиболее точную модель, учитывая коэффициенты детерминации и апроксимации. Так, уравнение регрессии наиболее точно отражает исходные данные. Так как коэффициент детерминации наибольший, а коэффициент апроксимации наименьший.

Задача 18. Имеются данные об урожайности картофеля, количество внесенных удобрений и доле высокосортных посевов (табл. 30). Определите показатели связи при множественной линейной зависимости расчетным путем с помощью инструмента анализа данных Регрессия и программы Statgraphics.

Таблица 30 - Данные для уравнения связи и коэффициента множественной корреляции

Номер хозяйства

Исходные данные

Расчетные данные

урожайность картофеля, ц/га ( )

внесено органических удобрений, т/га ( )

удельный вес высокосортных посевов, %

1

2

3

4

5

6

7

8

9

10

1

120

13

60

14400

169

3600

1560

7200

780

2

130

15

60

16900

225

3600

1950

7800

900

3

250

28

100

62500

784

10000

7000

25000

2800

4

200

25

95

40000

625

9025

5000

19000

2375

5

130

14

66

16900

196

4356

1820

8580

924

6

100

10

50

10000

100

2500

1000

5000

500

7

110

12

56

12100

144

3136

1320

6160

672

8

180

19

78

32400

361

6084

3420

14040

1482

9

120

14

58

14400

196

3364

1680

6960

812

10

160

15

70

25600

225

4900

2400

11200

1050

11

190

20

90

36100

400

8100

3800

17100

1800

12

180

17

81

32400

289

6561

3060

14580

1377

13

170

16

77

28900

256

5929

2720

13090

1232

14

140

17

60

19600

289

3600

2380

8400

1020

15

110

14

55

12100

196

3025

1540

6050

770

16

170

15

78

28900

225

6084

2550

13260

1170

17

210

23

96

44100

529

9216

4830

20160

2208

18

230

27

100

52900

729

10000

6210

23000

2700

19

190

20

90

36100

400

8100

3800

17100

1800

20

200

20

88

40000

400

7744

4000

17600

1760

Итого

3290

354

1508

576300

6738

118924

62040

261280

28132

Исследование формы зависимости между указанными признаками позволяет сделать вывод, что связь может быть выражена при помощи линейного уравнения

(44)

где - урожайность картофеля, ц/га;

- количество внесенных органических удобрений под картофель, т/га;

- удельный вес посевов высокосортными семенами, %.

Требуется определить параметры уравнения связи коэффициент множественной корреляции.

Решение: Составим систему нормальных уравнений с тремя неизвестными:

(45)

Подставив в эту систему данные из табл. 261, получим:

Разделим каждое из уравнений на коэффициенты при первом известном : первое уравнение - на 20, второе - на 354, третье - на 1508, получим:

Теперь поочередно вычтем первое уравнение из второго и третьего:

(175,2 - 164,5) = - + (19,0 - 17,7) + (79,5 - 75,4) ;

(173,3-164,5) = - + (18,6 – 17,7) + (78,9 – 75,4) .

Получим:

Разделив каждое из двух этих уравнений на коэффициент при , первое уравнение - на 1,3, второе - на 0,9, получим:

Из второго уравнения вычитаем первое и освобождаемся от параметра : 9,78 -8,23 = (3,8889 - 3,1538)а2, 1,55 = 0,73 5а2, отсюда а2 = 1,55 : 0,735 = 2,11. Подставляем значение а2 в уравнение 8,23 = + 3,1538 ∙ 2,11, отсюда = 1,58. Далее надо найти значение параметра ао, для чего используем уравнение 164,5 = + 17,7 ∙ 1,58 + 75,4 ∙ 2,11. Сделаем соответствующие расчеты: 164,5 = + 27,966 + 159,09; отсюда а0 .= - 22,6. Уравнение множественной линейной зависимости примет вид:

Параметры уравнения множественной регрессии показывают, что с увеличением дозы внесения органических удобрений на 1 т в расчете на 1 га урожайность картофеля возрастает на 1,58 ц, а повышение удельного веса высокосортных семян на 1 % дает прирост урожайности 2,11 ц. Параметр экономического смысла не имеет.

Теперь определим тесноту связи. Рассчитаем множественный (совокупный) коэффициент корреляции по формуле

(46)

Для его расчета надо найти средние значения , а также средние квадратические отклонения по урожайности, внесению удобрений и удельному весу высокосортных семян:

Теперь рассчитаем средние квадратические отклонения:

Рассчитаем парные коэффициенты корреляции:

Эти коэффициенты можно рассчитать с помощью MS Excel. В главном меню последовательно выбираем Данные /Анализ данных /Корреляция (рис. 32).

Рис. 32. Расчет коэффициентов корреляции

Так же можно воспользоваться программой Statgraphics, используя в расчетах функцию Multiple Variable Analisis (рис. 33).

Подставив значения коэффициента корреляции и детерминации в формулу множественной (совокупной) корреляции получим:

Связь между признаками очень тесная, так как коэффициент множественной корреляции составляет 0,981, а детерминации — 0,962. т.е. 96,2 % колебаний урожайности картофеля в данных условиях зависит от исследуемых факторов и только 3,8 % - от других, не уточненных в анализе.

Значимость оценим t-критерием Стьюдента:

Рис. 33. Расчет коэффициентов корреляции

Табличное значение t-критерия Стьюдента при 5 % уровне значимости и 17 степенях свободы (n-m=20-2-1=17) составляет 2,1098. Так как только при условии оба фактора , считаются значимыми. Однако меньше положенного. Поэтому величина является статистически незначимой, ненадежной, т.е. она сформировалась под воздействием случайных факторов. То же касается и величины .

Теперь воспользуемся инструментом анализа данных Регрессия (рис. 34).

Рис. 34. Результаты расчетов

Уравнение множественной линейной зависимости примет вид: . Коэффициент детерминации 0,9629.

Табличное значение F-критерий Фишера составило 3,59, расчетное – 220,59. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Решим эту же задачу с помощью программы Statgraphics, используя в расчетах функцию Multiple Regression (рис. 35).

Рис. 35. Результаты расчетов

Уравнение множественной линейной зависимости примет вид: . Случайные ошибки параметров , , равны , , . Эти значения указывают на величину, сформировавшуюся под воздействием случайных факторов. На их основе рассчитываются значения t-критерия Стьюдента: , , . На основе Приложения 2 определим критические значения t-критерия Стьюдента для уровня значимости , т.е. с вероятностью 0,95 составит 2,1098, , т.е. с вероятностью 0,99 – 2,8982. Статистически значимыми здесь являются , , а величина сформировалась под воздействием случайных причин.

Так как фактические значения больше теоретических (критических), то делаем вывод о существенности данных параметров ( и ), которые формируются под воздействием не случайных причин. Об это же свидетельствует показатель вероятности случайных значений параметров регрессии, так и То есть вероятность случайно получить такие значения t-критерия Стьюдента составляет 4,8 % и 0,0000, что не превышает допустимый уровень значимости 5 %.

Чуть ниже на рис. 44 представлен расчет F-критерий Фишера, и он составляет 29,23. Согласно дисперсионному анализу вероятность получить случайно такое значение F-критерий Фишера составляет 0,0000, что не превышает допустимый уровень значимости 5%.

Отсюда же берем нескорректированный коэффициент детерминации , который оценивает долю вариации результата в зависимости от факторов в общей вариации. Этот показатель показывает на достаточно высокую связь результата и от факторного признака. Скорректированный коэффициент детерминации оценивает тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и поэтому может сравниваться по разным моделям с разным числом факторов.

Табличное значение F-критерий Фишера составило 3,59, расчетное – 220,59. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо.

Задача 19. Определение показателей связи при парной криволинейной зависимости.

Пример решения задачи 19. Имеются данные по группе коров об их продуктивности возрасте (числе отелов) (табл. 31).

Таблица 31- Данные для уравнения связи и индекса корреляции (корреляционное отношение)

№ п/п

Исходные данные

Расчетные данные

относительное изменение удоя, %, ( )

возраст коров к моменту отела, лет ( )

1

79

2

4

8

16

158

316

80,649

198,16

154,45

2

82

2,5

6,25

15,625

39,06

205

512,5

83,965

122,7

83,032

3

87

3

9

27

81

261

783

86,979

36,929

37,185

4

92

3,5

12,25

42,875

150,06

322

1127

89,692

1,1598

11,459

5

94

4

16

64

256

376

1504

92,103

0,8521

0,9485

6

98

5

25

125

625

490

2450

96,021

24,237

8,6676

7

100

6

36

216

1296

600

3600

98,733

47,929

31,991

8

99

7

49

343

2401

693

4851

100,24

35,083

51,295

9

99

8

64

512

4096

792

6336

100,54

35,083

55,683

10

98

9

81

729

6561

882

7938

99,633

24,237

42,982

11

96

10

100

1000

10000

960

9600

97,521

8,5444

19,75

12

94

11

121

1331

14641

1034

11374

94,203

0,8521

1,2681

13

92

12

144

1728

20736

1104

13248

89,679

1,1598

11,546

Итого

1210

83

667,5

6141,5

60898,125

7877

63639,5

1210

536,92

510,26

Анализ исходных данных позволил установить, что зависимость криволинейная и может быть описана уравнением параболы 2-го порядка:

(47)

Требуется определить параметры уравнения связи и индекс корреляции.

Решение: Составим систему уравнений для нахождения параметров , , :

В систему уравнений подставим данные из табл. 266:

Разделим члены каждого уравнения на коэффициент при ао

Теперь из второго уравнения вычтем первое, а из третьего - второе:

Освободимся от коэффициента при , для чего все члены уравнения разделим на коэффициент при :

Из первого уравнения вычтем второе и получим 0,727=-1,206 , отсюда а2=-0,603. Подставим значения а2 в уравнение 1,103= +13,668∙(-0,603); отсюда = 9,345. В уравнение 93,077 = + 6,385 + 51,346a2 подставим значения найденных параметров и а2:

93,077 = а0 + 6,385∙9,345 + 51,346∙(- 0,603);

93,077 = + 59,668 - 30,962;

= 93,007 - 59,668 + 30,962;

= 64,371.

Следовательно, уравнение параболы второго порядка будет иметь следующий вид: = 64,371 + 9,345 - 0,603 .

Отрицательное значение а2 показывает, что с увеличением возраста коров до определенного предела (6-го отела) удой возрастает на 9,345 % с каждым новым отелом, а затем после определенного предела (с 6-го отела до 12-го отела) начинает падать в среднем на 0,603 % .

Когда связь между нелинейная (в нашем случае - параболическая), для измерения тесноты связи используют корреляционное отношение, которое рассчитывается по формуле:

Полученный результат свидетельствует о наличии тесной связи между возрастом коров и их продуктивностью, так как 95,03 % вариации в продуктивности связано с возрастом данной группы коров.

Решим эту же задачу с помощью программы Statgraphics, используя в расчетах функцию Polynomial Regression (рис. 36).

Рис. 36. Результаты расчетов

Уравнение парной криволинейной зависимости примет вид: .

Случайные ошибки параметров , , равны , , . Эти значения указывают на величину, сформировавшуюся под воздействием случайных факторов. На их основе рассчитываются значения t-критерия Стьюдента: , , . На основе Приложения 2 определим критические значения t-критерия Стьюдента для уровня значимости , т.е. с вероятностью 0,95 составит 2,2281, , т.е. с вероятностью 0,99 – 3,1693. Статистически значимыми здесь являются , , .

Так как фактические значения больше теоретических (критических), то делаем вывод о существенности данных параметров ( , и ), которые формируются под воздействием не случайных причин. Об это же свидетельствует показатель вероятности случайных значений параметров регрессии, так , и То есть вероятность случайно получить такие значения t-критерия Стьюдента составляет 0,0000 %, что не превышает допустимый уровень значимости 5 %.

Чуть ниже на рис. 45 представлен расчет F-критерий Фишера, и он составляет 71,06. Согласно дисперсионному анализу вероятность получить случайно такое значение F-критерий Фишера составляет 0,0000, что не превышает допустимый уровень значимости 5%.

Отсюда же берем нескорректированный коэффициент детерминации , который оценивает долю вариации результата в зависимости от факторов в общей вариации. Этот показатель показывает на достаточно высокую связь результата и от факторного признака. Скорректированный коэффициент детерминации оценивает тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и поэтому может сравниваться по разным моделям с разным числом факторов.

Задача 20. Имеются выборочные данные по 12 однородным предприятиям (табл. 32). Определите в программе Statgraphics уравнение регрессии, наиболее полно отражающее исходные данные. Оцените значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера.

Таблица 32 – Исходные данные

№ предприятия

Выпуск готовой продукции на одного рабочего, т

Электровооруженность труда на одного рабочего, кВтч

1

2

1

2

7

5

3

4

3

4

7

7

5

4

2

6

8

6

7

6

4

8

5

3

9

9

8

10

9

9

11

5

4

12

5

3

Построить однофакторную регрессионную модель.

Решение: воспользовавшись программой Statgraphics, получим следующие данные (табл. 33).

Таблица 33 – Уравнения регрессии, коэффициент детерминации и достоверность

№ п/п

Уравнение регрессии

P

P

F

P

1

90,68

4,86

0,007

9,86

0,0000

97,26

0,0000

2

86,59

14,01

0,0000

8,04

0,0000

64,58

0,0000

3

79,63

7,83

0,0000

6,25

0,0001

39,09

0,0001

4

59,81

7,92

0,0000

-3,86

0,0032

14,88

0,0032

5

92,27

-1,38

0,1965

10,93

0,0000

119,4

0,0000

6

93,50

-2,11

0,0608

11,99

0,0000

143,80

0,0000

7

92,39

5,64

0,0002

11,02

0,0000

121,49

0,0000

8

88,32

1,86

0,0932

8,70

0,0000

75,62

0,0000

9

90,09

-4,93

0,0006

9,53

0,0000

90,90

0,0000

10

91,44

3,01

0,0130

10,34

0,0000

106,89

0,0000

11

94,13

16,46

0,0000

12,66

0,0000

160,39

0,0000

12

94,14

10,30

0,0000

12,67

0,0000

160,63

0,0000

13

82,45

-1,43

0,1844

6,86

0,0000

47,00

0,0000

14

71,56

14,22

0,0000

-5,02

0,0005

25,17

0,0005

15

88,78

30,73

0,0000

-8,90

0,0000

79,15

0,0000

17

96,68

6,80

0,0000

17,08

0,0000

291,58

0,0000

18

55,25

7,34

0,0000

-3,51

0,0056

12,35

0,0056

19

79,81

9,12

0,0000

6,29

0,0001

39,54

0,0001

20

72,60

18,18

0,0000

5,15

0,0004

26,50

0,0004

21

63,14

11,73

0,0000

4,14

0,0020

17,3

0,0020

22

41,68

7,49

0,0000

-2,67

0,0234

7,15

0,0234

23

87,73

3,60

0,0048

8,46

0,0000

71,52

0,0000

Как видим из таблицы 5, 6, 8 и 13 уравнения отпадают, так как не соответствуют по уровню t-критерия Стьюдента. Наиболее полно отражает действительность 17 модель, так как коэффициент детерминации равен 96,68 %. Однако более точный выбор дал бы коэффициент апроксимации.