Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
элементы математической статистики 2121.Б.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.36 Mб
Скачать

4. Статистические характеристики вариационных рядов

После построения вариационного ряда и его графического изображения можно получить первоначальное представление о закономерностях наблюдаемого явления. Чаще всего о вариационном ряде удобно говорить в терминах, которые в теории вероятности назывались числовыми характеристиками случайных величин. Рассмотрим эти характеристики.

Если генеральная совокупность Х относительно небольшого объема, то можно анализировать всю совокупность.

Генеральной средней называют среднее арифметическое значений признака генеральной совокупности. Если все значения Х1, Х2,…, ХN различны (N – объем совокупности), то

Если же, что встречается чаще, значения признака имеют, соответственно, частоты N1, N2, … , Nk, причем N1+N2+…+ Nk = N, то

Очевидна аналогия между и математическим ожиданием, т.е. является оценкой математического ожидания М (Х).

Для оценки рассеивания количественного признака Х генеральной совокупности вокруг своего среднего значения используется генеральная дисперсия DГ – среднее арифметическое квадратов отклонений признака от их среднего значения . Для различных Х1, Х2, …, ХN.

Здесь _ среднее квадратов значений признака:

Если же значения признака имеют частоты N1, N2, …, Nk, то

но

Генеральным средним квадратическим отклонением (генеральным стандартом) называется

Если же генеральная совокупность – большого объема, то работа с ней становится очень громоздкой или невозможной. Тогда для изучения генеральной совокупности используют выборку конечного объема n.

Выборочной средней называется среднее арифметическое признака выборочной совокупности.

Для различных значений Х1, Х2, …, Хn.

Если значения признака Х1, Х2, …, Хk имеют, соответственно, частоты n1, n2, …, nk, причем n1 + n2 +… + nk = n, то

Выборочной дисперсией DB называется среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения

Для различных значений

Для значений Х1, Х2, …, Хk с частотами:

Выборочным средним квадратическим отклонением (выборочным стандартом) называется величина .

Хi

1

2

3

4

Ni

20

15

10

5

Здесь общая средняя:

Средняя квадратов:

Дисперсия:

Стандарт:

В примере намеренно не указан индекс характеристик, потому что расчеты как для генеральной, так и для выборочной совокупностей абсолютно аналогичны.

5. Оценки генеральной совокупности по выборке

Во многих случаях использование числовых характеристик выборки требует ответа на вопрос: насколько точно выборочные оценки соответствуют статистическим характеристикам генеральной совокупности, т.е. можно ли утверждать, что генеральная совокупность описывается числовыми характеристиками конечной выборки? Сформулируем некоторые критерии, которые следует предъявить к выборочным оценкам для положительного ответа на поставленный вопрос.

Для общности обозначим статистическую оценку неизвестного параметра S теоретического распределения (т.е. М (Х), D (X) и т.д.) через S* (т.е. и т.д.). Пусть по выборке объема n найдена оценка S1*. Повторим опыт – извлечем из генеральной совокупности другую выборку того же объема и найдем новую оценку S2*. Повторяя, можно получить числа S1*, S2*, …, Sk*. Ясно, что выборочные оценки S* можно рассматривать как случайную величину, а числа S1*, S2*, …, Sk* как ее возможные значения. Следовательно, к оценке соответствия характеристик S* и S можно подойти с вероятностных позиций.

При получении чисел S1*, S2*,…,Sk* будут, естественно, случайные отклонения. Но для достаточного числа измерений можно утверждать, что

М (S*) = S,

т.е. математическое ожидание оценки S* равно оцениваемому параметру S при любом объеме выборки. Такая статистическая оценка S* называется несмещенной. Если же равенство не соблюдается, т.е. М (S*) то оценку S* называют смещенной.

Не всегда можно утверждать, что несмещенная оценка дает хорошее приближение для S. Действительно, возможные значения S* могут быть сильно рассеяны вокруг своего среднего значения М (S*), т.е. дисперсия D(S*) может быть значительной. В этом случае, если, к примеру, взять по одной выборке оценку S1*, то она может быть сильно удалена от М (S*), а, значит, и от S. Приняв S1*, мы допустили бы большую ошибку. Но, если потребовать, чтобы дисперсия для S* была малой, то возможность допустить большую ошибку будет исключена. По этой причине к S* предъявляется требование эффективности.

Эффективной называют статистическую оценку S*, которая имеет наименьшую возможную дисперсию при заданном объеме выборки n.

И, наконец, при рассмотрении выборок большого объема, к статистическим оценкам предъявляется требование состоятельности.

Состоятельной называют статистическую оценку S*, которая при увеличении объема выборки стремится к оцениваемому параметру случайной величины.

К примеру, если дисперсия несмещенной оценки D (S*) при увеличении объема n стремится к нулю, то, очевидно, S* будет и состоятельной.

Рассмотрим теперь применение введенных критериев к изученным характеристикам. Пусть из генеральной совокупности признака Х извлечена выборка объема n со значениями х1, х2, …, хn. Генеральная средняя неизвестна и необходимо ее оценить по данным выборки.

В качестве оценки обычно принимают выборочную среднюю Можно доказать, что при достаточном объеме выборки эта оценка является несмещенной и состоятельной оценкой

Использование выборочной дисперсии DB в качестве оценки генеральной DГ уже не так уверенно. Доказано, что DB является смещенной оценкой, математическое ожидание выборочной дисперсии не равно оцениваемой DГ, а несколько ниже и равно:

Зная эту формулу, легко исправить выборочную дисперсию и использовать далее исправленную дисперсию:

Ясно, что исправленный стандарт определится формулой:

Из сравнения формул для DB и DИВ следует, что они отличаются только знаменателями. Если n – достаточно большое, то разница между DB и DИВ мала. На практике исправленной дисперсией DИВ вместо DВ пользуются обычно, если объем выборки n < 50.