Эконометрика_Практикум
.pdfGenerated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
Замечание. Число интервалов часто определяется самим исследователем. Однако лучше всего пользоваться таблицей, в которой приведено число интервалов в зависимости от объема выборки.
Объем выборки n |
30 50 |
50 90 |
100 200 |
300 400 |
Число интервалов k |
5 6 |
7 |
8 |
9 |
В нашей задаче объём выборки: n 50. Число интервалов k 6. 2. Определим длину интервала. Найдём границы интервалов.
Вычислите шаг разбиения h xmax xmin . Для этого: k
Введите исходные данные.
Произведите сортировку элементов первого столбца по возрастанию (см. пример 1).
Определите минимальное и максимальное значения признака с по-
мощью функций МИН и МАКС.
Получаем, что максимальный доход равен 17 xmax 17 , а минимальный
5 xmin 5 .
Пользуясь формулой, найдите длину интервала h 17 5 2 . 6
Найдите границы интервалов: к границам предыдущего интервала прибавьте длину интервала h 2.
Составьте структуру таблицы:
|
A |
B |
C |
D |
E |
F |
G |
1 |
Построение интервального вариационного ряда |
|
|
|
|||
2 |
|
|
|
|
|
|
|
3 |
Исходные данные |
|
Результаты вычислений |
|
|||
4 |
Начальное |
Конечное |
Длина |
Частота |
Плотность |
Относительная |
Плотность |
|
значение |
значение |
интервала |
интервала |
частоты |
частота |
относи- |
|
|
|
h |
ni |
ni/h |
wi |
тельной |
|
|
|
(=B5-A5) |
|
(=D5/C5) |
(=D5/50) |
частоты |
|
|
|
|
|
|
|
wi/h |
|
|
|
|
|
|
|
(=F5/C5) |
5 |
5 |
7 |
|
|
|
|
|
6 |
7 |
9 |
|
|
|
|
|
7 |
9 |
11 |
2 |
|
|
|
|
8 |
11 |
13 |
|
|
|
|
|
|
|
|
|
|
|||
9 |
13 |
15 |
|
|
|
|
|
10 |
15 |
17 |
|
|
|
|
|
11 |
|
|
|
|
|
|
|
3. Находим частоты интервалов.
Подсчитайте частоты каждого интервала (количество наблюдаемых значений СВ Х, попавших в i-й интервал), находя в заданном ряду значения,
удовлетворяющие неравенству: |
xлев |
x xпр |
, i 1,2,...,6. |
|
i |
i |
|
11
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
В частности, для первого интервала таких значений три, для второго девять и т. д., то есть n1 3 , n2 9 , n3 17, n4 10 , n5 7 , n6 4 .
Найдите относительные частоты по формуле i ni . Для этого введите n
соответствующие формулы в ячейки таблицы и скопируйте их. (см. пример 1).
4. Тогда интервальный статистический ряд имеет вид:
|
A |
B |
C |
D |
E |
F |
G |
1 |
Построение интервального вариационного ряда |
|
|
|
|||
2 |
|
|
|
|
|
|
|
3 |
Исходные данные |
|
Результаты вычислений |
|
|||
4 |
Начальное |
Конечное |
Длина |
Частота |
Плотность |
Относительная |
Плотность |
|
значение |
значение |
интервала |
интервала |
частоты |
частота |
относи- |
|
|
|
h |
ni |
ni/h |
wi |
тельной |
|
|
|
(=B5-A5) |
|
(=D5/C5) |
(=D5/50) |
частоты |
|
|
|
|
|
|
|
wi/h |
|
|
|
|
|
|
|
(=F5/C5) |
5 |
5 |
7 |
|
3 |
1,5 |
0,06 |
|
6 |
7 |
9 |
|
9 |
4,5 |
0,18 |
|
7 |
9 |
11 |
2 |
17 |
8,5 |
0,34 |
|
8 |
11 |
13 |
10 |
5 |
0,20 |
|
|
|
|
||||||
9 |
13 |
15 |
|
7 |
3,5 |
0,14 |
|
10 |
15 |
17 |
|
4 |
2 |
0,08 |
|
11 |
Объём выборки n (=СУММ(D5:D10)) |
50 |
|
1 |
|
Б) Интервальный статистический ряд наглядно может быть представлен в виде гистограммы частот – столбиковой диаграммы, состоящей из прямоугольников, основаниями которых служат подынтервалы, а высота
n
равна i (плотность частоты). h
Для построения гистограммы относительных частот основание прямо-
угольника также равно h, а высота |
ni |
|
i |
|
|
n h |
h . |
||||
|
Гистограмма строится с помощью Мастера диаграмм.
ni/h
Гистограмма частот
9
8
7
6
5
4
3
2
1
0
5-7 |
7-9 |
9-11 |
11-13 |
13-15 |
15-17 |
xi
Рис. 3. Гистограмма частот
12
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
Задачи:
1. Анализируются объёмы ежедневных продаж некоторого товара за 50
дней. Получены следующие данные: |
|
|
|
|
|
||||
50, |
50, |
50, |
50, |
51, |
51, |
51, |
51, |
45, |
45, |
42, |
42, |
43, |
43, |
43, |
44, |
44, |
44, |
44, |
44, |
45, |
45, |
45, |
45, |
46, |
48, |
48, |
48, |
48, |
49, |
49, |
48, |
49, |
49, |
44, |
44, |
45, |
45, |
45, |
48, |
48, |
46, |
46, |
46, |
44, |
46, |
45, |
45, |
45, |
46. |
Необходимо:
А) Построить дискретный статистический ряд; Б) определить размах выборки; В) построить полигон относительных частот;
Г) определить выборочные среднюю, дисперсию, среднее квадратическое отклонение.
|
2. Анализируются объёмы ежедневных продаж некоторого товара за 60 |
||||||||||||||||||||
дней. Получены следующие данные: |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
5, |
6, |
3, |
2, |
|
7, |
7, |
6, |
6, |
10, |
11, |
6, |
4, |
5, |
6, |
3, |
12, |
9, |
10, |
7, |
4, |
|
6, |
7, |
8, |
8, |
|
10, |
5, |
5, |
4, |
3, |
6, |
|
6, |
7, |
7, |
8, |
8, |
10, |
6, |
4, |
5, |
6, |
12, |
7, |
7, |
8, |
11, |
9, |
10, |
5, |
4, |
6, |
2, |
7, |
11, |
8, |
7, |
9, |
5, |
6, |
9, |
5. |
Необходимо:
А) построить дискретный статистический ряд; Б) определить размах выборки; В) построить полигон относительных частот;
Г) определить выборочные среднюю, дисперсию, среднее квадратическое отклонение.
3. Анализируется продолжительность телефонных разговоров с клиентами накоторой справочной телефонной службы. Случайным образом отобраны 60 телефонных разговоров и зафиксированы их длительности (в се-
кундах): |
|
|
|
|
|
|
|
|
|
|
|
39 |
60 |
40 |
52 |
32 |
68 |
77 |
61 |
68 |
60 |
47 |
49 |
70 |
55 |
66 |
80 |
35 |
67 |
70 |
55 |
42 |
52 |
60 |
82 |
70 |
55 |
47 |
39 |
50 |
58 |
45 |
50 |
53 |
33 |
49 |
54 |
55 |
70 |
62 |
60 |
60 |
40 |
59 |
64 |
70 |
55 |
54 |
35 |
48 |
52 |
57 |
55 |
82 |
70 |
51 |
35 |
49 |
60 |
55 |
47. |
13
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
Необходимо:
А) построить интервальный статистический ряд, включающий 5 подынтервалов;
Б) построить гистограмму и по её виду выдвинуть предположение о законе распределения рассматриваемой случайной величины;
В) вычислить выборочные числовые характеристики рассматриваемой величины на основании построенного интервального ряда (выборочные среднюю, дисперсию, среднее квадратическое отклонение).
4. Построить интервальный вариационный ряд и гистограмму по следующим данным:
29 34 31 25 36 32 33 28 25
35 33 31 30 28 33 34 37 39
33 32 30 24 26 27 32 34 36
31 34 38 40 37 44 38 27 25
34 31 35 29 31 35 38 29 33
5. В результате испытаний случайная величина Х приняла следующие
значения: |
|
|
|
|
|
|
|
|
|
16 |
17 |
9 |
13 |
21 |
11 |
7 |
7 |
19 |
5 |
17 |
5 |
20 |
18 |
11 |
4 |
6 |
22 |
21 |
15 |
Требуется найти среднее арифметическое значение, дисперсию, среднее квадратическое отклонение.
6.На 10 лекциях по эконометрике на одном из потоков присутствовало студентов: 104, 113, 120, 98, 105, 88, 102, 110, 99, 108.
Оценить среднее число студентов на лекции, а также дисперсию и среднее квадратическое отклонение.
7.Оценить генеральную среднюю и генеральную дисперсию роста мужчин (Х) в возрасте 40 лет:
162 |
168 |
176 |
180 |
191 |
177 |
171 |
178 |
165 |
185 |
14
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
Семинары 2-4. Парная корреляция и линейная регрессия
Решение типовых задач:
Пример 1. В таблице приведены данные за 8 лет о совокупном доходе x (у.е.) и расходах на конечное потребление y (у.е.).
x |
10 |
12 |
11 |
12 |
14 |
15 |
17 |
20 |
y |
7 |
8 |
8 |
10 |
11 |
12 |
14 |
16 |
Требуется:
1)Сформулировать гипотезу о направлении связи.
2)Проверить свое предположение, построив поле корреляции.
3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.
4)Рассчитать параметры уравнения линейной регрессии y на x .
5)Оценить общее качество полученного уравнения.
6)Проверить значимость уравнения в целом, используя F- статистику.
7)Проверить значимость коэффициентов уравнения (t – статистики).
8)Проверить гипотезу об отсутствии автокорреляции.
9)Оформить вывод по построенной модели.
10)Спрогнозировать значение расходов на конечное потребление, если прогнозное значение совокупного дохода составит 21,5 у.е. Рассчитать 95%-й доверительный интервал для данного предсказания.
Решение:
1)В нашей задаче можно предположить, что расходы на конечное потребление положительно связаны с совокупным доходом (т.е. с увеличением дохода расходы также увеличиваются).
Проверим наше предположение.
2)Графический метод.
Заметим вначале, что объем выборки n 8 . Представим ряды значений графически.
Построение графиков осуществляется с помощью Мастера диаграмм
в MS Excel.
Порядок построения следующий:
1.Введите исходные данные или откройте существующий файл, содержащий анализируемые данные;
2.Активизируйте Мастер диаграмм одним из способов:
А) в главном меню выберите Вставка\Диаграмма; Б) на панели инструментов Стандартная нажмите на кнопку Мастер
диаграмм;
15
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
3.В окне Тип выберите Точечная; вид графика выберите в поле рядом со списком типов. Нажмите кнопку Далее.
4.Заполните диапазон данных. Установите флажок размещения данных в столбцах (строках). Нажмите кнопку Далее.
5.Заполните параметры диаграммы на разных закладках: название диаграммы и осей, значения осей, линии сетки, параметры легенды, таблица и подписи данных. Нажмите Далее.
6.Укажите место размещения диаграммы на отдельном или имеющемся листе. Нажмите Далее.
Готовая диаграмма, представляющая собой поле корреляции, готова.
потребление. |
18 |
|
|
|
|
|
16 |
|
|
|
|
|
|
14 |
|
|
|
|
|
|
12 |
|
|
|
|
|
|
10 |
|
|
|
|
|
|
конеч |
|
|
|
|
|
|
8 |
|
|
|
|
|
|
6 |
|
|
|
|
|
|
на |
|
|
|
|
|
|
4 |
|
|
|
|
|
|
расходы |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
0 |
5 |
10 |
15 |
20 |
25 |
|
|
|
совокупный доход |
|
|
Вывод: Анализ графика показывает, что точки (xi ; yi ) сосредоточены в области, очерченной вытянутым эллипсом, поэтому можно предположить наличие сильной положительной линейной связи между показателями. Т.о. анализ графика подтвердил нашу гипотезу.
3) Для определения направления и тесноты взаимосвязи с помощью статистических методов рассчитаем показатель ковариации и коэффициент линейной корреляции.
Для этого в MS Excel:
1.Введите исходные данные или откройте существующий файл, содержащий анализируемые данные;
2.Выделите пустую ячейку, в которую будет выведено значение показателя ковариции (или коэффициента линейной корреляции).
3.Активизируйте Мастер функций (в главном меню выберите Встав-
ка\Функция).
4.Выберите категорию Статистические – функция КОВАР (или КОРРЕЛ) – нажмите ОК.
16
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
5. Заполните аргументы функции:
Массив 1 – диапазон, содержащий данные результативного признака у. Массив 2 – диапазон, содержащий данные факторов независимого признака х.
Нажмите ОК.
6. В выделенной ячейке появится значение показателя ковариции (или коэффициента линейной корреляции).
В рассматриваемом примере показатель ковариации: cov x, y 9,09375.
Вывод: Значение показателя cov x, y 0 . Это подтверждает нашу ги-
потезу о наличии положительной связи между показателями. Коэффициент линейной корреляции r 0,9826.
Вывод: Полученный коэффициент корреляции близок к +1, это указывает на сильную положительную линейную связь между расходами на конечное потребление и совокупным доходом.
Проверим значимость полученного коэффициента корреляции.
С этой целью проверяется нулевая гипотеза (H0 : 0) о том, что зна-
чение коэффициента корреляции для генеральной совокупности равно нулю, т.е. в генеральной совокупности отсутствует корреляция. Альтернативной
является гипотеза (H1 : 0). |
|
|
|||||
|
Для проверки этой |
гипотезы рассчитаем t–статистику по формуле: |
|||||
|
|
|
|
|
|
|
|
t r |
|
n 2 |
t 0,9826 |
|
8 2 |
|
12,958. |
|
1 r 2 |
|
1 (0,9826)2 |
||||
|
|
|
|
|
|
Находим табличное критическое значение t–критерия. Для этого в Excel можно воспользоваться встроенной функцией СТЬЮДРАСПОБР( ; ):
Выберем уровень значимости 0,05, при заданном числе степеней свободы п 2 6 получим критическое значение tкр (0,05;6) 2,445.
Так как t tкр (12,958>3,707), следовательно, мы можем отвергнуть
нулевую гипотезу о равенстве теоретического коэффициента корреляции нулю, и, как следствие, гипотезу об отсутствии связи между показателями. То есть связь между показателями, выраженная коэффициентом корреляции, статистически значима с вероятностью 0,95 (риск ошибки 0,05 или 5%).
Вывод: Итогом проведённых расчётов может стать вывод о том, что расходы на конечное потребление действительно линейно положительно связны с величиной располагаемого дохода, и связь эта является статистически значимой. Таким образом проверяемая нами гипотеза получила свое подтверждение на выбранном массиве данных.
17
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
4) Рассчитаем параметры уравнения линейной регрессии y на x .
В MS Excel реализованы два способа «компьютерной» оценки параметров линейной регрессии:
1. статистическая встроенная функция ЛИНЕЙН;
2. инструмент РЕГРЕССИЯ пакета Анализ данных.
1. Функция ЛИНЕЙН определяет параметры линейной регрессии: А) Введите исходные данные;
Б) Выделите область пустых ячеек 5×2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики (или 1×2 для получения только оценок коэффициентов);
В) Активизируйте Мастер функций (в главном меню Встав-
ка/Функция);
Г) Выберите категорию Статистические – функция ЛИНЕЙН – ОК. Д) Заполните аргументы функции:
Известные значения у – диапазон, содержащий данные результативного признака.
Известные значения х – диапазон, содержащий данные факторов независимого признака.
Константа – логическое значение, которое указывает на наличие или отсутствие свободного члена в уравнении.
(1 – свободный член присутствует, 0 – свободный член равен 0).
Статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет.
(1 – дополнительная информация выводится,
|
|
0 – выводятся только оценки параметров). |
|
Е) В левой верхней ячейке выделенной области появится первый эле- |
|||
мент итоговой таблицы. |
|
||
Чтобы открыть всю таблицу нажмите F2 , затем одновременно ком- |
|||
бинация CTRL SHIFT ENTER . |
|
||
|
|
|
|
Коэффициент b |
Коэффициент а |
||
Среднее квадратическое отклонение b |
Среднее квадратическое отклонение а |
||
( Sb ) |
( Sa ) |
||
Коэффициент детерминации R2 |
Стандартная ошибка ( S ) |
||
F-статистика |
Число степеней свободы |
||
Регрессионная (факторная) сумма |
Остаточная сумма квадратов |
||
квадратов ( уˆ |
у |
)2 |
( у уˆ)2 е2 |
18
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
В рассматриваемом примере результат вычислений будет выглядеть следующим образом:
0,922345 |
-2,04754 |
0,071204 |
1,012935 |
0,965477 |
0,632372 |
167,7959 |
6 |
67,10063 |
2,399366 |
2. Использование инструмента анализа РЕГРЕССИЯ А) В главном меню последовательно выберите Сервис/Надстройки.
Установите Пакет анализа - ОК.
Б) В главном меню Сервис/ Анализ / Регрессия – ОК.
В) В диалоговом окне:
Входной интервал у – диапазон, содержащий данные результативного признака.
Входной интервал х – диапазон, содержащий данные факторов независимого признака.
Метки – флажок указывает, содержит первая строка названия столбцов. Константа-ноль – флажок указывает на отсутствие константы в урав-
нении.
Выходной интервал – указать левую верхнюю ячейку диапазона, куда будут выводиться результаты.
Новый рабочий лист – по умолчанию результаты выводятся на новый лист. Остатки – флажок указывает, выводить информацию об остатках и
график остатков. В заключение нажмите ОК.
Г) Полученные результаты будут иметь вид:
|
Регрессионная статистика |
|
Множественный R |
|
Коэффициент парной корреляции |
R -квадрат |
|
Коэффициент детерминации |
Нормированный R –квадрат |
|
Скорректированный коэффициент детерминации |
Стандартная ошибка |
|
S |
Наблюдения |
|
Количество наблюдений |
19
Generated by Foxit PDF Creator © Foxit Software
http://www.foxitsoftware.com For evaluation only.
Таблица дисперсионного анализа
|
Df – |
SS |
– сумма |
MS |
– диспер- |
F – |
на- |
Значи- |
|||||||||
|
число |
квадратов от- |
сия |
на |
одну |
блюд. |
- |
мость F – |
|||||||||
|
степе- |
клонений |
|
степень |
свобо- |
Значение |
уровень |
||||||||||
|
ней |
|
|
|
|
|
ды |
|
|
|
|
|
|
критерия |
значимости |
||
|
свобо- |
|
|
|
|
|
|
|
|
|
|
|
|
|
Фишера |
F |
|
|
ды |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрес- |
1 |
Факторная |
( уˆ |
у |
)2 |
|
|
|
|
|
|||||||
сия |
|
( уˆ |
у |
)2 |
|
|
|
|
|
|
|
|
|
|
|
||
Остаток |
n 2 |
Остаточная |
S |
2 |
|
ei2 |
- |
|
- |
||||||||
|
|
(у уˆ)2 е2 |
|
n 2 |
|
|
|
||||||||||
Итого |
n 1 |
Общая |
|
|
2 |
|
( y |
y |
)2 |
- |
|
- |
|||||
|
|
( у |
|
|
|
2 |
Sy |
|
|
|
|
|
|
|
|
||
|
|
у) |
|
|
|
|
n 1 |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
Замечание: ( у у)2 = ( уˆ у)2 + (у уˆ)2 .
Оценки параметров регрессии, наблюдаемое значение критерия Стьюдента, доверительные интервалы указаны в таблице:
|
Коэффи- |
Стан- |
t- |
P- |
Нижние |
Верхние |
|
циенты |
дартная |
стати- |
значе- |
95% |
95% |
|
|
ошибка |
стика |
ние |
|
|
Y- |
а |
Sa |
ta |
уровень |
Нижняя |
Верхняя |
пересе- |
|
|
|
значи- |
граница |
граница |
чение |
|
|
|
мости ta |
довери- |
довери- |
|
|
|
|
|
тельного |
тельного |
|
|
|
|
|
интерва- |
интерва- |
|
|
|
|
|
ла коэф. |
ла коэф. |
|
|
|
|
|
а |
а |
Пере- |
b |
Sb |
tb |
уровень |
Нижняя |
Верхняя |
менная |
|
|
|
значи- |
граница |
граница |
X |
|
|
|
мости tb |
довери- |
довери- |
|
|
|
|
|
тельного |
тельного |
|
|
|
|
|
интерва- |
интерва- |
|
|
|
|
|
ла коэф. |
ла коэф. |
|
|
|
|
|
b |
b |
20