Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика_Практикум

.pdf
Скачиваний:
80
Добавлен:
01.06.2015
Размер:
820.09 Кб
Скачать

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Замечание. Число интервалов часто определяется самим исследователем. Однако лучше всего пользоваться таблицей, в которой приведено число интервалов в зависимости от объема выборки.

Объем выборки n

30 50

50 90

100 200

300 400

Число интервалов k

5 6

7

8

9

В нашей задаче объём выборки: n 50. Число интервалов k 6. 2. Определим длину интервала. Найдём границы интервалов.

Вычислите шаг разбиения h xmax xmin . Для этого: k

Введите исходные данные.

Произведите сортировку элементов первого столбца по возрастанию (см. пример 1).

Определите минимальное и максимальное значения признака с по-

мощью функций МИН и МАКС.

Получаем, что максимальный доход равен 17 xmax 17 , а минимальный

5 xmin 5 .

Пользуясь формулой, найдите длину интервала h 17 5 2 . 6

Найдите границы интервалов: к границам предыдущего интервала прибавьте длину интервала h 2.

Составьте структуру таблицы:

 

A

B

C

D

E

F

G

1

Построение интервального вариационного ряда

 

 

 

2

 

 

 

 

 

 

 

3

Исходные данные

 

Результаты вычислений

 

4

Начальное

Конечное

Длина

Частота

Плотность

Относительная

Плотность

 

значение

значение

интервала

интервала

частоты

частота

относи-

 

 

 

h

ni

ni/h

wi

тельной

 

 

 

(=B5-A5)

 

(=D5/C5)

(=D5/50)

частоты

 

 

 

 

 

 

 

wi/h

 

 

 

 

 

 

 

(=F5/C5)

5

5

7

 

 

 

 

 

6

7

9

 

 

 

 

 

7

9

11

2

 

 

 

 

8

11

13

 

 

 

 

 

 

 

 

 

9

13

15

 

 

 

 

 

10

15

17

 

 

 

 

 

11

 

 

 

 

 

 

 

3. Находим частоты интервалов.

Подсчитайте частоты каждого интервала (количество наблюдаемых значений СВ Х, попавших в i-й интервал), находя в заданном ряду значения,

удовлетворяющие неравенству:

xлев

x xпр

, i 1,2,...,6.

 

i

i

 

11

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

В частности, для первого интервала таких значений три, для второго девять и т. д., то есть n1 3 , n2 9 , n3 17, n4 10 , n5 7 , n6 4 .

Найдите относительные частоты по формуле i ni . Для этого введите n

соответствующие формулы в ячейки таблицы и скопируйте их. (см. пример 1).

4. Тогда интервальный статистический ряд имеет вид:

 

A

B

C

D

E

F

G

1

Построение интервального вариационного ряда

 

 

 

2

 

 

 

 

 

 

 

3

Исходные данные

 

Результаты вычислений

 

4

Начальное

Конечное

Длина

Частота

Плотность

Относительная

Плотность

 

значение

значение

интервала

интервала

частоты

частота

относи-

 

 

 

h

ni

ni/h

wi

тельной

 

 

 

(=B5-A5)

 

(=D5/C5)

(=D5/50)

частоты

 

 

 

 

 

 

 

wi/h

 

 

 

 

 

 

 

(=F5/C5)

5

5

7

 

3

1,5

0,06

 

6

7

9

 

9

4,5

0,18

 

7

9

11

2

17

8,5

0,34

 

8

11

13

10

5

0,20

 

 

 

9

13

15

 

7

3,5

0,14

 

10

15

17

 

4

2

0,08

 

11

Объём выборки n (=СУММ(D5:D10))

50

 

1

 

Б) Интервальный статистический ряд наглядно может быть представлен в виде гистограммы частот – столбиковой диаграммы, состоящей из прямоугольников, основаниями которых служат подынтервалы, а высота

n

равна i (плотность частоты). h

Для построения гистограммы относительных частот основание прямо-

угольника также равно h, а высота

ni

 

i

 

n h

h .

 

Гистограмма строится с помощью Мастера диаграмм.

ni/h

Гистограмма частот

9

8

7

6

5

4

3

2

1

0

5-7

7-9

9-11

11-13

13-15

15-17

xi

Рис. 3. Гистограмма частот

12

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Задачи:

1. Анализируются объёмы ежедневных продаж некоторого товара за 50

дней. Получены следующие данные:

 

 

 

 

 

50,

50,

50,

50,

51,

51,

51,

51,

45,

45,

42,

42,

43,

43,

43,

44,

44,

44,

44,

44,

45,

45,

45,

45,

46,

48,

48,

48,

48,

49,

49,

48,

49,

49,

44,

44,

45,

45,

45,

48,

48,

46,

46,

46,

44,

46,

45,

45,

45,

46.

Необходимо:

А) Построить дискретный статистический ряд; Б) определить размах выборки; В) построить полигон относительных частот;

Г) определить выборочные среднюю, дисперсию, среднее квадратическое отклонение.

 

2. Анализируются объёмы ежедневных продаж некоторого товара за 60

дней. Получены следующие данные:

 

 

 

 

 

 

 

 

 

 

 

5,

6,

3,

2,

 

7,

7,

6,

6,

10,

11,

6,

4,

5,

6,

3,

12,

9,

10,

7,

4,

6,

7,

8,

8,

 

10,

5,

5,

4,

3,

6,

 

6,

7,

7,

8,

8,

10,

6,

4,

5,

6,

12,

7,

7,

8,

11,

9,

10,

5,

4,

6,

2,

7,

11,

8,

7,

9,

5,

6,

9,

5.

Необходимо:

А) построить дискретный статистический ряд; Б) определить размах выборки; В) построить полигон относительных частот;

Г) определить выборочные среднюю, дисперсию, среднее квадратическое отклонение.

3. Анализируется продолжительность телефонных разговоров с клиентами накоторой справочной телефонной службы. Случайным образом отобраны 60 телефонных разговоров и зафиксированы их длительности (в се-

кундах):

 

 

 

 

 

 

 

 

 

 

 

39

60

40

52

32

68

77

61

68

60

47

49

70

55

66

80

35

67

70

55

42

52

60

82

70

55

47

39

50

58

45

50

53

33

49

54

55

70

62

60

60

40

59

64

70

55

54

35

48

52

57

55

82

70

51

35

49

60

55

47.

13

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Необходимо:

А) построить интервальный статистический ряд, включающий 5 подынтервалов;

Б) построить гистограмму и по её виду выдвинуть предположение о законе распределения рассматриваемой случайной величины;

В) вычислить выборочные числовые характеристики рассматриваемой величины на основании построенного интервального ряда (выборочные среднюю, дисперсию, среднее квадратическое отклонение).

4. Построить интервальный вариационный ряд и гистограмму по следующим данным:

29 34 31 25 36 32 33 28 25

35 33 31 30 28 33 34 37 39

33 32 30 24 26 27 32 34 36

31 34 38 40 37 44 38 27 25

34 31 35 29 31 35 38 29 33

5. В результате испытаний случайная величина Х приняла следующие

значения:

 

 

 

 

 

 

 

 

 

16

17

9

13

21

11

7

7

19

5

17

5

20

18

11

4

6

22

21

15

Требуется найти среднее арифметическое значение, дисперсию, среднее квадратическое отклонение.

6.На 10 лекциях по эконометрике на одном из потоков присутствовало студентов: 104, 113, 120, 98, 105, 88, 102, 110, 99, 108.

Оценить среднее число студентов на лекции, а также дисперсию и среднее квадратическое отклонение.

7.Оценить генеральную среднюю и генеральную дисперсию роста мужчин (Х) в возрасте 40 лет:

162

168

176

180

191

177

171

178

165

185

14

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Семинары 2-4. Парная корреляция и линейная регрессия

Решение типовых задач:

Пример 1. В таблице приведены данные за 8 лет о совокупном доходе x (у.е.) и расходах на конечное потребление y (у.е.).

x

10

12

11

12

14

15

17

20

y

7

8

8

10

11

12

14

16

Требуется:

1)Сформулировать гипотезу о направлении связи.

2)Проверить свое предположение, построив поле корреляции.

3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.

4)Рассчитать параметры уравнения линейной регрессии y на x .

5)Оценить общее качество полученного уравнения.

6)Проверить значимость уравнения в целом, используя F- статистику.

7)Проверить значимость коэффициентов уравнения (t – статистики).

8)Проверить гипотезу об отсутствии автокорреляции.

9)Оформить вывод по построенной модели.

10)Спрогнозировать значение расходов на конечное потребление, если прогнозное значение совокупного дохода составит 21,5 у.е. Рассчитать 95%-й доверительный интервал для данного предсказания.

Решение:

1)В нашей задаче можно предположить, что расходы на конечное потребление положительно связаны с совокупным доходом (т.е. с увеличением дохода расходы также увеличиваются).

Проверим наше предположение.

2)Графический метод.

Заметим вначале, что объем выборки n 8 . Представим ряды значений графически.

Построение графиков осуществляется с помощью Мастера диаграмм

в MS Excel.

Порядок построения следующий:

1.Введите исходные данные или откройте существующий файл, содержащий анализируемые данные;

2.Активизируйте Мастер диаграмм одним из способов:

А) в главном меню выберите Вставка\Диаграмма; Б) на панели инструментов Стандартная нажмите на кнопку Мастер

диаграмм;

15

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

3.В окне Тип выберите Точечная; вид графика выберите в поле рядом со списком типов. Нажмите кнопку Далее.

4.Заполните диапазон данных. Установите флажок размещения данных в столбцах (строках). Нажмите кнопку Далее.

5.Заполните параметры диаграммы на разных закладках: название диаграммы и осей, значения осей, линии сетки, параметры легенды, таблица и подписи данных. Нажмите Далее.

6.Укажите место размещения диаграммы на отдельном или имеющемся листе. Нажмите Далее.

Готовая диаграмма, представляющая собой поле корреляции, готова.

потребление.

18

 

 

 

 

 

16

 

 

 

 

 

14

 

 

 

 

 

12

 

 

 

 

 

10

 

 

 

 

 

конеч

 

 

 

 

 

8

 

 

 

 

 

6

 

 

 

 

 

на

 

 

 

 

 

4

 

 

 

 

 

расходы

 

 

 

 

 

2

 

 

 

 

 

0

 

 

 

 

 

 

0

5

10

15

20

25

 

 

 

совокупный доход

 

 

Вывод: Анализ графика показывает, что точки (xi ; yi ) сосредоточены в области, очерченной вытянутым эллипсом, поэтому можно предположить наличие сильной положительной линейной связи между показателями. Т.о. анализ графика подтвердил нашу гипотезу.

3) Для определения направления и тесноты взаимосвязи с помощью статистических методов рассчитаем показатель ковариации и коэффициент линейной корреляции.

Для этого в MS Excel:

1.Введите исходные данные или откройте существующий файл, содержащий анализируемые данные;

2.Выделите пустую ячейку, в которую будет выведено значение показателя ковариции (или коэффициента линейной корреляции).

3.Активизируйте Мастер функций (в главном меню выберите Встав-

ка\Функция).

4.Выберите категорию Статистические – функция КОВАР (или КОРРЕЛ) – нажмите ОК.

16

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

5. Заполните аргументы функции:

Массив 1 – диапазон, содержащий данные результативного признака у. Массив 2 – диапазон, содержащий данные факторов независимого признака х.

Нажмите ОК.

6. В выделенной ячейке появится значение показателя ковариции (или коэффициента линейной корреляции).

В рассматриваемом примере показатель ковариации: cov x, y 9,09375.

Вывод: Значение показателя cov x, y 0 . Это подтверждает нашу ги-

потезу о наличии положительной связи между показателями. Коэффициент линейной корреляции r 0,9826.

Вывод: Полученный коэффициент корреляции близок к +1, это указывает на сильную положительную линейную связь между расходами на конечное потребление и совокупным доходом.

Проверим значимость полученного коэффициента корреляции.

С этой целью проверяется нулевая гипотеза (H0 : 0) о том, что зна-

чение коэффициента корреляции для генеральной совокупности равно нулю, т.е. в генеральной совокупности отсутствует корреляция. Альтернативной

является гипотеза (H1 : 0).

 

 

 

Для проверки этой

гипотезы рассчитаем t–статистику по формуле:

 

 

 

 

 

 

 

 

t r

 

n 2

t 0,9826

 

8 2

 

12,958.

 

1 r 2

 

1 (0,9826)2

 

 

 

 

 

 

Находим табличное критическое значение t–критерия. Для этого в Excel можно воспользоваться встроенной функцией СТЬЮДРАСПОБР( ; ):

Выберем уровень значимости 0,05, при заданном числе степеней свободы п 2 6 получим критическое значение tкр (0,05;6) 2,445.

Так как t tкр (12,958>3,707), следовательно, мы можем отвергнуть

нулевую гипотезу о равенстве теоретического коэффициента корреляции нулю, и, как следствие, гипотезу об отсутствии связи между показателями. То есть связь между показателями, выраженная коэффициентом корреляции, статистически значима с вероятностью 0,95 (риск ошибки 0,05 или 5%).

Вывод: Итогом проведённых расчётов может стать вывод о том, что расходы на конечное потребление действительно линейно положительно связны с величиной располагаемого дохода, и связь эта является статистически значимой. Таким образом проверяемая нами гипотеза получила свое подтверждение на выбранном массиве данных.

17

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

4) Рассчитаем параметры уравнения линейной регрессии y на x .

В MS Excel реализованы два способа «компьютерной» оценки параметров линейной регрессии:

1. статистическая встроенная функция ЛИНЕЙН;

2. инструмент РЕГРЕССИЯ пакета Анализ данных.

1. Функция ЛИНЕЙН определяет параметры линейной регрессии: А) Введите исходные данные;

Б) Выделите область пустых ячеек 5×2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики (или 1×2 для получения только оценок коэффициентов);

В) Активизируйте Мастер функций (в главном меню Встав-

ка/Функция);

Г) Выберите категорию Статистические – функция ЛИНЕЙН ОК. Д) Заполните аргументы функции:

Известные значения у – диапазон, содержащий данные результативного признака.

Известные значения х – диапазон, содержащий данные факторов независимого признака.

Константа – логическое значение, которое указывает на наличие или отсутствие свободного члена в уравнении.

(1 – свободный член присутствует, 0 – свободный член равен 0).

Статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет.

(1 – дополнительная информация выводится,

 

 

0 – выводятся только оценки параметров).

Е) В левой верхней ячейке выделенной области появится первый эле-

мент итоговой таблицы.

 

Чтобы открыть всю таблицу нажмите F2 , затем одновременно ком-

бинация CTRL SHIFT ENTER .

 

 

 

 

 

Коэффициент b

Коэффициент а

Среднее квадратическое отклонение b

Среднее квадратическое отклонение а

( Sb )

( Sa )

Коэффициент детерминации R2

Стандартная ошибка ( S )

F-статистика

Число степеней свободы

Регрессионная (факторная) сумма

Остаточная сумма квадратов

квадратов ( уˆ

у

)2

( у уˆ)2 е2

18

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

В рассматриваемом примере результат вычислений будет выглядеть следующим образом:

0,922345

-2,04754

0,071204

1,012935

0,965477

0,632372

167,7959

6

67,10063

2,399366

2. Использование инструмента анализа РЕГРЕССИЯ А) В главном меню последовательно выберите Сервис/Надстройки.

Установите Пакет анализа - ОК.

Б) В главном меню Сервис/ Анализ / Регрессия – ОК.

В) В диалоговом окне:

Входной интервал у – диапазон, содержащий данные результативного признака.

Входной интервал х – диапазон, содержащий данные факторов независимого признака.

Метки – флажок указывает, содержит первая строка названия столбцов. Константа-ноль – флажок указывает на отсутствие константы в урав-

нении.

Выходной интервал – указать левую верхнюю ячейку диапазона, куда будут выводиться результаты.

Новый рабочий лист – по умолчанию результаты выводятся на новый лист. Остатки – флажок указывает, выводить информацию об остатках и

график остатков. В заключение нажмите ОК.

Г) Полученные результаты будут иметь вид:

 

Регрессионная статистика

Множественный R

 

Коэффициент парной корреляции

R -квадрат

 

Коэффициент детерминации

Нормированный R –квадрат

 

Скорректированный коэффициент детерминации

Стандартная ошибка

 

S

Наблюдения

 

Количество наблюдений

19

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Таблица дисперсионного анализа

 

Df

SS

– сумма

MS

– диспер-

F

на-

Значи-

 

число

квадратов от-

сия

на

одну

блюд.

-

мость F

 

степе-

клонений

 

степень

свобо-

Значение

уровень

 

ней

 

 

 

 

 

ды

 

 

 

 

 

 

критерия

значимости

 

свобо-

 

 

 

 

 

 

 

 

 

 

 

 

 

Фишера

F

 

ды

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Регрес-

1

Факторная

( уˆ

у

)2

 

 

 

 

 

сия

 

( уˆ

у

)2

 

 

 

 

 

 

 

 

 

 

 

Остаток

n 2

Остаточная

S

2

 

ei2

-

 

-

 

 

(у уˆ)2 е2

 

n 2

 

 

 

Итого

n 1

Общая

 

 

2

 

( y

y

)2

-

 

-

 

 

( у

 

 

 

2

Sy

 

 

 

 

 

 

 

 

 

 

у)

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

Замечание: ( у у)2 = ( уˆ у)2 + (у уˆ)2 .

Оценки параметров регрессии, наблюдаемое значение критерия Стьюдента, доверительные интервалы указаны в таблице:

 

Коэффи-

Стан-

t-

P-

Нижние

Верхние

 

циенты

дартная

стати-

значе-

95%

95%

 

 

ошибка

стика

ние

 

 

Y-

а

Sa

ta

уровень

Нижняя

Верхняя

пересе-

 

 

 

значи-

граница

граница

чение

 

 

 

мости ta

довери-

довери-

 

 

 

 

 

тельного

тельного

 

 

 

 

 

интерва-

интерва-

 

 

 

 

 

ла коэф.

ла коэф.

 

 

 

 

 

а

а

Пере-

b

Sb

tb

уровень

Нижняя

Верхняя

менная

 

 

 

значи-

граница

граница

X

 

 

 

мости tb

довери-

довери-

 

 

 

 

 

тельного

тельного

 

 

 

 

 

интерва-

интерва-

 

 

 

 

 

ла коэф.

ла коэф.

 

 

 

 

 

b

b

20