Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УМК Математика.doc
Скачиваний:
3
Добавлен:
01.05.2025
Размер:
2.51 Mб
Скачать

Статистические характеристики вариационных рядов

О вариационном ряде удобнее всего говорить в терминах, которые в теории вероятностей называют числовыми характеристиками случайных величин.

Генеральной средней называют среднее арифметическое значений признака генеральной совокупности. Если все значения различны (N – объем совокупности), то

.

Если значения признака имеют, соответственно, частоты , причем , то .

Аналогия между и математическим ожиданием очевидна, т.е. является оценкой математического ожидания М(Х).

Генеральная дисперсия (оценка рассеивания признака Х генеральной совокупности относительно среднего значения ) - среднее арифметическое квадратов отклонений признака от их среднего значения . Для различных :

.

Здесь - среднее квадратов значений признака: .

Если значения признака имеют частоты , то

, где

; .

Генеральным средним квадратическим отклонением (генеральным стандартом) называют .

При больших объемах генеральной совокупности работают с выборками конечного объема n.

Выборочной средней называется среднее арифметическое признака выборочной совокупности.

Для различных значений : .

Если значения признака имеют частоты , причем , то .

Выборочной дисперсией называют среднее арифметическое квадратов отклонений признака от их среднего значения .

Для различных значений:

.

Для значений с соответствующими частотами:

.

Выборочном средним квадратическим отклонением (выборочным стандартом) называется величина .

В качестве примера рассмотрим распределение:

Хi

1

2

3

4

Ni

20

15

10

5

Здесь общая средняя: .

Средняя квадратов: .

Дисперсия: . Стандарт .

В этом примере не указан индекс характеристик, т.к. расчеты для генеральной и для выборочной совокупности аналогичны.

Оценки генеральной совокупности по выборке

Сформулируем некоторые критерии, которым должны отвечать выборочные оценки, чтобы они как можно точнее соответствовали статистическим характеристикам генеральной совокупности.

Обозначим статистическую оценку неизвестного параметра S теоретического распределения (т.е. М(Х), D(Х) и т.д.) через S* (т.е. , и т.д.). Пусть по выборке объема n найдена оценка . Повторим опыт – извлечем из генеральной совокупности другую выборку того же объема и найдем новую оценку . Повторяя, можно получить числа , ,… . Ясно, что выборочные оценки S* можно рассматривать как случайные величины, а числа как её возможные значения. Следовательно, к оценке соответствия характеристик S* и S можно подойти с позиций теории вероятностей.

При получении чисел , ,… будут, естественно, случайные отклонения. Но для достаточного числа измерений можно утверждать, что , т.е. математическое ожидание оценки равно оцениваемому параметру S при любом объеме выработки. Такая статистическая оценка называется несмещенной. Если же равенство не соблюдается, т.е. , то оценку называют смещенной.

Возможные значения могут быть сильно рассеяны вокруг своего среднего значения , т.е. может быть значительной. В этом случае необходимо потребовать, чтобы дисперсия для была малой, тогда возможность допустить большую ошибку будет исключена. По этой причине к предъявляют требование эффективности.

Эффективной называют статистическую оценку , которая имеет наименьшую Возможную дисперсию при заданном объеме выборки n.

Состоятельной называют статистическую оценку , которая при увеличении объема выборки (т.е. n+1, n+2 и т.д.) стремится к оцениваемому параметру генеральной совокупности.

Пусть из генеральной совокупности признака Х извлечена выборка объема n со значениями . По данным выборки необходимо оценить генеральную среднюю. В качестве оценки обычно принимают выборочную среднюю . При достаточном объеме выборки эта оценка является несмещенной и состоятельной оценкой .

Использование выборочной дисперсии в качестве оценки генеральной уже не так уверенно. Доказано, что является смещенной оценкой, математическое ожидание выборочной дисперсии не равно оцениваемой , а несколько ниже и равно . Зная эту формулу, можно исправить выборочную дисперсию и использовать далее исправленную дисперсию: . В этом случае исправленный стандарт .

Из сравнения формул для и следует, что они отличаются только знаменателями. Если n достаточно большое, то разница между ними мала. На практике исправленной дисперсией вместо пользуются обычно, если объем выборки n<50.