Эконометрика.
Задача эконометрики заключается в оценивании параметров генеральной совокупности и в установлении зависимости объясняемых переменных от одного или нескольких объясняющих переменных на основании данных эмпирических наблюдений. Напомним основные понятия математической статистики и эконометрики, необходимые для выполнения контрольной работы.
Парный регрессионный анализ.
Предположим, что две величины, и , связаны между собой стохастической зависимостью вида , где нормально распределенная случайная величина, с нулевым математическим ожиданием и среднем квадратичным уклонением , не зависящая от . Производится независимых наблюдений, в каждом из которых мы отслеживаем значения пары . Результатом такого статистического опыта является следующая выборка объема : , , …, .
На основании этих данных мы пытаемся установить точечные и интервальные оценки параметров , , а также точечные и интервальные оценки индивидуальных и средних значений переменной при различных уровнях фактора .
Теорема Гаусса—Маркова утверждает, что статистическими оценками параметров , , имеющими наименьшую дисперсию в классе линейных несмещенных оценок, являются следующие величины. Оценкой является величина
где
Для оценки параметра служит величина
Теперь, если значение параметра задано, то точечная оценка параметра вычисляется по формуле .
Интервальные оценки для , , а также оценки значений объясняемой переменной , основаны на следующей точечной оценке параметра случайной величины (стохастической части зависимости ):
.
Доверительный интервал для параметра уравнения линейной регрессии с доверительной вероятностью имеет вид: ,
где - критическая точка распределения Стьюдента с доверительной вероятностью и числом степеней свободы .
Доверительный интервал для оценки дисперсии случайной величины с доверительной вероятностью имеет вид: ,
где критическая точка распределения с доверительной вероятностью и числом степеней свободы .
Доверительный интервал для средних значений объясняемой переменной при выбранном уровне значений переменной с доверительной вероятностью имеет вид
, где ,
а , попрежнему, критическая точка распределения Стьюдента с доверительной вероятностью и числом степеней свободы .
Доверительный интервал для индивидуальных значений объясняемой переменной при выбранном уровне значений переменной с доверительной вероятностью будет шире и определяется неравенством ,
где .
После определения параметров регрессионной модели следует проверить гипотезу о значимости линейного уравнения регрессии. Значимость уравнения регрессии означает, что линейная часть в зависимости является существенной, отличной от нуля. Уравнение регрессии является незначимым, если разброс данных таков, что от выбора значений практически ничего не зависит, и изменения наблюдаемой величины объясняется лишь наличием стохастической зависимости вида . Зададимся уровнем значимости гипотезы, равным (уровень значимости гипотезы есть вероятность отвергнуть утверждение гипотезы в случае, когда оно на самом деле справедливо). Тогда гипотеза о значимости линейного уравнения регрессии принимается, если ,
где есть коэффициент детерминации, определяемый по формуле
,
а – критическая точка распределения ФишераСнедекора с уровнем значимости и числом степеней свободы 1 и . В противном случае гипотезу о значимости регрессии на данном уровне значимости отвергают.
Если коэффициент детерминации достаточно велик, и уравнение линейной регрессии можно считать значимым, то показывает, какая доля в изменении значений переменной обязана изменению линейной части в соотношении , в отличие от стохастической части , которая обуславливает разброс значений независимо от выбора .
Квадратичная регрессия объясняемой переменной на объясняющую переменную есть точечная оценка параметров стохастической зависимости
,
где нормально распределенная случайная величина с нулевым математическим ожиданием и средним квадратичным уклонением , не зависящая от выбора . Чтобы найти несмещенные точечные оценки , , параметров , , методом Гаусса, составим функцию .
Искомые оценки есть решение задачи ,
которая по теореме Ферма сводится к решению следующей невырожденной системы линейных уравнений на неизвестные параметры , , :
что может быть записано в виде
Вычислив коэффициенты при неизвестных в этой системе уравнений, мы любым известным способам (например, методом последовательных исключений переменных Гаусса) можем решить эту систему и определить значения коэффициентов квадратичной регрессии.
Задача 13.1. Имеются следующие данные о сменной добыче угля на одного рабочего y (т) и мощности пласта x (м) по 10 различным шахтам:
i |
1 |
2 |
3 |
4 |
5 |
xi |
19 |
28 |
24 |
17 |
26 |
yi |
16 |
24 |
22 |
15 |
24 |
i |
6 |
7 |
8 |
9 |
10 |
xi |
17 |
19 |
24 |
17 |
26 |
yi |
15 |
26 |
23 |
16 |
15 |
В предположении, что между условным среднем и x имеется связь вида , где - нормально распределенная случайная величина (не зависящая от x) с нулевым математическим ожиданием и среднем квадратичным уклонением , определить: