Методы исследований в менеджменте. Статистические выводы. Оценки и проверка гипотез
Лекция № 3. Статистические выводы: оценки и проверка
гипотез
3.1 Точечные оценки и их свойства
3.2 Свойства выборочных оценок
3.3 Интервальные оценки
3.4 Проверка гипотез: основные понятия
3.5 Критерии проверки. Критическая область
Статистические выводы – это заключения о генеральной совокупности (т. е. о законе распределения исследуемой СВ и его параметрах либо о наличии и силе связи между исследуемыми переменными) на основе выборки, случайно отобранной из генеральной совокупности.
При исследовании различных параметров генеральной совокупности на основе выборки возможно лишь получение оценок этих параметров. Эти оценки строятся на основе ограниченного набора данных, что влечет за собой вероятность погрешности. Заметим, что значения оценок могут изменяться от выборки к выборке. Процесс нахождения оценок по определенному правилу (формуле) будем называть оцениванием. Цель любого оценивания – получение наиболее точного значения оцениваемой характеристики.
Можно выделить два типа оценивания: оценивание вида распределения и оценивание параметров распределения. В качестве оценки вида распределения (в силу закона больших чисел) можно взять выборочное распределение, подсчитав частоты попадания рассматриваемой СВ в заданные подынтервалы интервального статистического ряда. Процедура оценивания всегда однотипна. На основе выборки с помощью соответствующей формулы рассчитывается оценка исследуемой характеристики. В качестве оценок параметров распределения генеральной совокупности берутся их выборочные оценки. При этом различают два вида оценок — точечные и интервальные.
После определения оценок обычно встает вопрос об их качестве и статистической значимости. С другой стороны, часто до определения оценок выдвигаются предположения о значениях исследуемых параметров. Анализ соответствия результатов выборки выдвигаемым предположениям и определение статистической значимости полученных выводов обычно осуществляются по схеме статистической проверки гипотез, что также требует рассмотрения.
3.1 Точечные оценки и их свойства
Пусть оценивается некоторый параметр наблюдаемой СВ Х генеральной совокупности. Пусть из генеральной совокупности извлечена выборка объема п: х1, х2, хn, по которой может быть найдена оценка параметра . Например, для нормального закона распределения с плотностью вероятности
параметрами являются математическое ожидание т и среднее квадратическое отклонение σ.
Точечной оценкой параметра называется числовое значение этого параметра, полученное по выборке объема п.
Оценка является функцией от выборки, т. е. = (х1, х2, хn). Так как выборка носит случайный характер, то оценка является СВ, принимающей различные значения для различных выборок. Любую оценку (х1, х2, хn) называют статистикой или статистической оценкой параметра .
Число ε такое, что называется точностью оценки Естественно стремление получить по возможности наиболее точную оценку при данном объеме выборки.
Приведем свойства, выполнимость которых желательна для того, чтобы оценка была признана удовлетворительной.
В силу случайности точечной оценки она может рассматриваться как СВ со своими числовыми характеристиками — математическим ожиданием и дисперсией . Чем ближе к истинному значению и чем меньше , тем лучше будет оценка (при прочих равных условиях). Таким образом, качество оценок характеризуется следующими основными свойствами: несмещенность, эффективность и состоятельность.
Оценка называется несмещенной оценкой параметра , если ее математическое ожидание равно оцениваемому параметру: = .
Хотя каждая отдельная оценка лишь в редких случаях совпадает с соответствующей характеристикой генеральной совокупности, при «аккуратном» оценивании многократное осуществление выборок одного объема п обеспечивает совпадение среднего значения оценки по всем выборкам с истинным значением оцениваемого параметра.
Разность - называется смещением или систематической ошибкой оценивания. Для несмещенных оценок систематическая ошибка равна нулю.
Свойство несмещенности оценки является важнейшим, но не единственным. Зачастую существует несколько возможных оценок одного и того же параметра. Какая из них лучше? Очевидно, выбор будет сделан в пользу той из них, вероятность совпадения которой с истинным значением оцениваемого параметра выше. Оценка должна иметь такую плотность вероятности, которая наиболее «сжата» вокруг истинного значения оцениваемого параметра. Нетрудно заметить, что в этом случае она будет иметь наименьшую среди других оценок дисперсию.
Оценка называется эффективной оценкой параметра , если ее дисперсия меньше дисперсии любой другой альтернативной оценки при фиксированном объеме выборки п, т.е. = . На рисунке 3.1 приведена схема, наглядно демонстрирующая преимущество эффективной оценки по сравнению с неэффективной оценкой параметра .
Каждая отдельная эффективная оценка не гарантирует того, что она дает более точное значение исследуемого параметра, чем менее эффективная. Однако вероятность такого исхода превышает 0,5.
Оценка называется асимптотически эффективной, если с увеличением объема выборки ее дисперсия стремится к нулю, т.е. при (индекс n в оценке применяется для подчеркивания объема выборки).
Рисунок 3.1 Рисунок 3.2
Оценка называется состоятельной оценкой параметра , если сходится по вероятности к при , т. е. для любого при . Другими словами, состоятельной называется такая оценка, которая дает истинное значение при достаточно большом объеме выборки вне зависимости от значений входящих в нее конкретных наблюдений.
Схема возможного улучшения точности (несмещенности) состоятельной оценки приведена на рисунке 3.2.
В большинстве случаев несмещенная оценка является и состоятельной. С другой стороны, состоятельные оценки (возможно, не являющиеся несмещенными при малых объемах выборок) с увеличением объема выборки будут приближаться и лежать все «плотнее» к истинному значению (рисунок 3.2). Это указывает на асимптотическую несмещенность состоятельной оценки. Поэтому при невозможности получения несмещенной оценки целесообразно найти хотя бы состоятельную оценку.
Справедливо следующее утверждение: если и при , то - состоятельная оценка параметра .
Оценки, являющиеся линейными функциями от выборочных наблюдений, называются линейными.
Очень важную роль в эконометрике играют так называемые наилучшие линейные несмещенные оценки, или коротко BLUE-оценки (Best Linear Unbiased Estimators). Такие оценки, являясь линейными и несмещенными, имеют наименьшую дисперсию среди всех возможных оценок данного класса.