- •Лекция 1
- •1.1. Введение в теоретические основы исследования статистических выборок.
- •1.1. Введение в теоретическин основы исследования статистических выборок.
- •1.2. Подходы статистического оценивания
- •1.3. Свойства среднего
- •1.4. Комплекс задач проблемы оценивания параметров закона распределения.
- •Лекция 2
- •2.1. Статистическая устойчивость выборочных характеристик.
- •2.2. Статистические оценки и их свойства.
- •2.1. Статистическая устойчивость выборочных характеристик
- •2.2. Статистические оценки и их свойства
- •Лекция 3
- •3.2. Распределение t-Стьюдента
- •3.4. Пример определения эмпирической дисперсии
- •3.2. Распределение t- стьюдента
- •3.4. Пример определения эмпирической дисперсии
- •Из этих условий следует, что
- •Лекция 4
- •4.1. Метод моментов Пирсона.
- •4 .2. Метод наименьших квадратов.
- •4.3. Метод максимального правдоподобия.
- •4.1. Метод моментов пирсона
- •4.2. Метод наименьших квадратов
- •4.3.Метод максимального правдоподобия
- •Лекция 5
- •5.1. Точность и достоверность оценок параметров распределения.
- •5.2. Доверительные оценки параметров распределения.
- •5.1. Точность и достоверность оценок параметров распределения.
- •5.2. Доверительные оценки параметров распределения
- •Лекция 6
- •6.2. Гипотеза независимости и стационарности обрабатываемого ряда наблюдений.
- •6.3. Анализ резко выделяющихся наблюдений
- •6.4. Гипотеза о типе закона распределения случайной величины.
- •6.5. Гипотезу об однородности двух или нескольких выборок.
- •6.6. Гипотезы о числовых значениях параметров генеральной совокупности.
- •Лекция 7
- •7.1. Сравнение доли признака с нормативом.
- •7.2. Сравнение статистических частот, вычисленных по двум выборкам.
- •7.1. Сравнение доли признака с нормативом
- •7.2. Сравнение статистических частот, вычисленных по двум выборкам.
- •Лекция 8
- •8.1. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (выборки незпвисимы).
- •8.2. Сравнение двух средних, произвольно распределенных генеральных совокупностей (выборки большого объема и независимы).
- •8.3. Сравнение двых средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).
- •8.4. Сравнение выборочной средней с гипотетичесчкой генеральной средней нормальной совокупности.
2.2. Статистические оценки и их свойства
Опытной основой научного исследования является наблюдение, которое условно можно разделить на два типа. При наблюдениях первого типа производят единичные измерения исследуемого свойства у каждого из n однородных объектов; при наблюдениях второго типа производится n измерений исследуемого свойства у одного объекта. Исследуемое свойство характеризуется некоторой величиной X.
Допустим, что условия, в которых протекают наблюдения, остаются неизменными от наблюдения к наблюдению. Однако результаты n наблюдений не будут одинаковыми: от наблюдения к наблюдению они испытывают неправильные колебания. Это явление объясняется тем, что невозможно полностью учесть ничтожно малые флуктуации большого числа возмущающих факторов. Следовательно, признак Х можно интерпретировать как некоторую случайную величину, значения которой определяют на основе наблюдений.
Статистическое наблюдение может быть сплошным или выборочным. Первое предполагает наблюдение всех изучаемых объектов. Однако по ряду причин оно может оказаться принципиально неосуществимым. В реальных задачах прибегают к наблюдению части случайных объектов и по его результатам делают выводы о свойствах всей совокупности. Такой метод наблюдения получил название выборочного, отобранная для изучения часть объектов называется выборкой, а вся исходная совокупность объектов — генеральной совокупностью. Объемом совокупности называют число объектов этой совокупности.
Информация о генеральной совокупности, полученная на основе выборочного распределения, всегда будет обладать некоторой неполнотой (погрешностью), так как основывается на изучении только части элементов. Это обусловливает две взаимосвязанные проблемы:
•как организовать выборочное наблюдение, чтобы указанная информация была наиболее полной (проблема представительности выборки);
•как использовать выборку для определения с максимальной достоверностью оценок параметров распределения,
Формировать выборку можно двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В первом случае выборки повторные, во втором — бесповторные.
Выборка является представительной, если она отображает основные закономерности генеральной совокупности.
В силу закона больших чисел можно утверждать, что выборка будет представительной, если ее сформировать случайным образом: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.
Если объем генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками несущественно. В предельном случае, когда рассматривается бесконечная генеральная совокупность, а выборка имеет конечный объем, это различие исчезает.
На практике применяют различные способы отбора.
1. Отбор, не требующий расчленения генеральной совокупности на части; случайный бесповторный отбор; случайный повторный отбор.
2. Отбор, при котором генеральная совокупность разбивается на части: типический отбор; механический; серийный.
Простым случайным называют такой отбор, при котором объекты извлекают по одному из генеральной совокупности.
Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее типической части. Так, если детали изготавливают на нескольких станках, то отбор производят не из всей совокупности деталей, выполненных всеми станками, а из продукции каждого станка в отдельности. Типический отбор используют в том случае, когда признак заметно колеблется в различных типических частях генеральной совокупности.
Механическим называют отбор, при котором генеральную совокупность "механически" делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект. Например, если нужно отобрать 20% изготовленных станком деталей, то отбирают каждую пятую деталь.
Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а "сериями", которые затем подвергаются сплошному обследованию. Серийным отбором пользуются тогда, когда признак колеблется в различных сериях незначительно.
Предположим из
генеральной совокупности извлечена
выборка, причем
наблюдалось
раз,
-
раз и т.д.:
-объем выборки.
Наблюдаемое
значение
называют вариантой, последовательность
вариант, записанных в возрастающем
порядке — вариационным рядом. Числа
наблюдений называют частотами, а их
отношения к объему выборки
— относительными частотами
.
Рассмотрим задачу
изучения количественного признака
генеральной совокупности. Допустим,
что на основе теоретических соображений
установлен закон распределения признака.
В этом случае возникает задача оценки
параметров распределения. Решение
этой
задачи может
быть осуществлено только на основе
выборки
,
полученной в результате n
наблюдений. Следовательно, оценка
параметра θ будет выборочной функцией
от реализации выборки
.
Найти статистическую оценку неизвестного параметра теоретического распределения -это значит найти функцию от наблюдаемых случайных величин, которая и дает искомое значение оценки
Определяя оценки параметров, необходимо учитывать, что аргументы выборочной функции являются случайными величинами, а это значит, что оценка также будет случайной величиной и ее можно характеризовать законом распределения и числовыми характеристиками.
Итак, статистической
оценкой неизвестного параметра
теоретического распределения или
статистикой называют функцию от
наблюдаемых случайных величин
.
=Θ(
).
Для того чтобы статистические оценки давали "хорошие" приближения оцениваемых параметров, они должны удовлетворять определенным требованиям.
Допустим, необходимо оценить по выборке параметр θ. Для получения хорошей оценки Θ необходимо, чтобы значение , подсчитанное по данным выборки, оказалось с достаточно высокой вероятностью близким к истинному значению параметра θ. Достичь этого при малом объеме выборки маловероятно, так как велика роль случайного отбора. Рассмотрим предельный случай при n→∞ и потребуем при этом, чтобы статистика стремилась по вероятности к оцениваемому параметру, т.е. чтобы для любого заданного ε>о выполнялось предельное равенство
или
Θ
(1)
Статистика , удовлетворяющая этому условию, получила название состоятельной. Состоятельность - асимптотическое свойство, которое означает, что распределение статистики с ростом n концентрируется в сколь угодно малой окрестности параметра θ и представляет собой закон больших чисел применительно к статистике .
При оценке
генеральной средней
с помощью выборочной средней
свойство (1) представляет собой утверждение
теоремы Чебышева. Единственным условием
выполнимости (1) является существование
.
Однако, если генеральное распределение
есть распределение Коши
то свойство
состоятельности не имеет места, так как
для этого распределения вообще не
существует математическое ожидание.
Допустим, что по
выборке объема n
найдена оценка
параметра θ. Повторим опыт, т.е. извлечем
из генеральной совокупности. К выборок
и определим оценки
,
которые различны между собой. Таким
образом, оценку
можно рассматривать как случайную
величину, а числа
как ее возможные значения.
Оценка
может дать приближенное значение θ с
избытком или с недостатком. В первом
случае каждая найденная по выборкам
оценка
больше истинного значения θ, что приводит
к неравенству E(
)
> θ . Во втором случае получим неравенство
вида E(
)
< θ.
Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам.
Естественно
потребовать, чтобы математическое
ожидание оценки
было равно оцениваемому параметру.
Несмещенной называют оценку , математическое ожидание которой не равно оцениваемому параметру θ, т.е. Е| | =0.
Это свойство может
носить и асимптотический характер
К оценке θ следует предъявить асимптотическое требование вида
(2)
Асимптотическая несмещенность есть условие того, что центр распределения неограниченно приближается к θ. Условие (2) указывает на то, что распределение стягивается в пределе к своему центру.
Несмещенная оценка
не всегда дает хорошее приближение
параметра θ. Возможные значения θ
могут быть
сильно рассеяны вокруг своего среднего
значения, т.е. дисперсия оценки D[
]
может быть значительной. В этом случае
найденная по данным одной выборки оценка
может оказаться весьма удаленной от
среднего значения
,
а значит, и от самого оцениваемого
параметра θ. Приняв
в качестве приближенного значения θ,
мы могли бы допустить большую ошибку.
Если потребовать, чтобы дисперсия оценки
D[
]
была
малой величиной, то возможность допустить
большую ошибку будет исключена.
Эффективной называют оценку, которая ( при заданном объеме выборки n ) имеет наименьшую возможную дисперсию.
Итак, оценка неизвестного параметра должна обладать свойствами: несмещенности, состоятельности и эффективности.
