Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика. 2 лекция.doc
Скачиваний:
48
Добавлен:
15.04.2015
Размер:
338.43 Кб
Скачать

Группированный статистический ряд. Гистограмма.

Для представления о законе распределения нет необходимости строить статистическую функцию распределения F*(x) по каждому наблюдённому значению случайной величины. Этим целям лучше служат группированный статистический ряд и гистограмма.

Группированным статистическим рядом называется таблица, где в верхней строке указаны разряды, в нижней – соответствующие им частоты

Х:

Причём

Частота события вычисляется как отношение числа опытов, в которых значение случайной величины Х попало в i-й разряд , к общему числу n произведённых опытов. Для примера, приведённого выше, можно построить группированный статистический ряд, выбрав «круглые» границы разрядов: (70-80); (80-90); (90-100); (100-110); (110-120); (120-130).

Подсчитывая количество значений случайной величины, попавших в каждый разряд (считая половинки от попавших в границу между разрядами) и деля на число опытов n=100, получим группированный статистический ряд:

[(70-80)-0,02]; [(80-90)-0,14]; [(90-100)-0,34]; [(100-110)-0,29]; [(110-120)-0,15]; [(120-130)-0,06].

Деля каждую частоту на длину соответствующего разряда получим таблицу плотностей частоты :

[(70-80)-0,002]; [(80-90)-0,014]; [(90-100)-0,034]; [(100-110)-0,029]; [(110-120)-0,015];

[(120-130)-0,006].

Откладывая по оси абсцисс разряды и строя на каждом разряде как на основании прямоугольник площади, получим гистограмму – статистический аналог кривой распределения.

-0,04

-0,03

-0,02

-0,01

70 80 90 100 110 120 130 х

Имея группированный статистический ряд, можно приближённо построить статистическую функцию распределения F*(x)

F*(70)=0; F*(80)=P*{X<80}=0,02; F*(90)=P*{X<90}=0,16; F*(100)=P*{X<100}=0,50; F*(110)=P*(X<110}=0,79; F*(120)=P*{X<120}=0,94; F*(130)=1.

Выравнивание статистических распределений

В связи с ограниченностью числа опытов в статистических распределениях присутствуют элементы случайности, которые сглаживаются лишь при большом числе опытов. Для удобства пользования данными на практике подбирают для данного статистического распределения аналитическую функцию, выражающую лишь существенные черты статистического материала. Такая задача называется задачей выравнивания статистических распределений. Это чаще всего применяется к гистограммам, заменяя их плавной кривой с простым аналитическим выражением для использования в дальнейшем в качестве плотности распределения f(x).

В методе подбора значителен элемент творчества, опыта, интуиции, знания физической сущности изучаемого явления.

Y

* * *

*

* * *

* * * *

* * * *

* * *

* * *

0 x

Y

* *

* * *

* * * *

* *

0 x

На рисунках показаны примеры выбора функций по статистическим данным измерений. При сглаживании часто используют «метод наименьших квадратов», для которого сумма квадратов отклонений обращается в минимум.

На практике часто бывает, что случайная величина складывается из многих независимых или слабо зависимых слагаемых, сравнимых по порядку влияния на рассеивание суммы. В этом случае естественна в качестве выравнивающей нормальная плотность:

и необходимо подбирать, исходя из опытных данных только параметры и m в этом выражении. Если, например, случайная величина Х есть расстояние между соседними событиями потока, то в качестве выравнивающего закона можно взять показательный или какой-нибудь из законов Эрланга.

При этом необходимо иметь ввиду, что любая аналитическая функция f(x), используемая для выравнивания гистограммы, должна обладать основными свойствами плотности:

Параметры, входящие в функцию f(x), подбирают для лучшего согласования статистического и аналитического распределения различными методами, чаще всего – методом моментов, когда совпадают важнейшие моменты: математическое ожидание, дисперсия, иногда высшие моменты (моментами выше четвёртого порядка пользоваться нерационально, т.к. точность вычисления моментов резко падает с увеличением их порядка.

Пример 2.1.

Угол высоты объекта над горизонтом измеряется с помощью секстана, где случайная величина Х – ошибка измерения угла. Для оценки точности прибора произведено 500 измерений ошибки (в тысячных долях радиана). Результаты измерений сведены в группированный статистический ряд:

Х:

Разряды

(-4)-(-3)

(-3)-(-2)

(-2)-(-1)

(-1)-(0)

0-1

1-2

2-3

3-4

Частоты

0,012

0,050

0,144

0,266

0,240

0,176

0,092

0,020

Число попаданий в i-й разряд ni

6

25

72

133

120

88

46

10

Здесь ni = n

Построить гистограмму распределения. Выровнять статистическое распределение с помощью нормального закона:

,

Подобрав параметры и m так, чтобы сохранить неизменными первые два момента статистического распределения: математическое ожидание и дисперсию.

Решение.

Для этого нужно знать статистическое среднее и статистическую дисперсию случайной величины Х. Известно, что при большом числе наблюдений среднее арифметическое сходится по вероятности к её МО, а среднее арифметическое их квадратов – ко второму начальному моменту . В данном случае мы не располагаем всеми 500 значениями Х, а если бы и располагали, процесс вычисления был бы громоздким. Ограничимся определением так называемых «грубых» моментов по группированному ряду. Для этого выбираем в качестве «представителя» i-го разряда его середину и этому значению и приписываем ему частоту . Приближённое значение статистического среднего найдём как сумму произведений всех на :

=-3,5 .0,012-2,5.0,050-1,5.0,144-0,5.0,266+0,5.0,240+1,5.0,176+2,5.0,092+3,5.0,0200,168.

Статистический второй начальный момент:

=(-3,5)2.0,012+(-2,5)2.0,050+(-1,5)2.0,144+

+(-0,5)2.0,266+0,52.0,240+1,52.0,176+2,52.0,092+3,52.0,0202,126

Вычитая из квадрат среднего значения ()2 , получим статистическую дисперсию:

2,098, откуда

Полагая в выражении нормальной плотности m=0,168; , и пользуясь таблицей значений нормальной плотности распределения, получим значения на границах разрядов:

f(-4)=0,0045; f(-3)=0,0256; f(-2)=0,0895; f(-1)=0,1986; f(0)=0,2740; f(1)=0,2343; f(2)=0,1244; f(3)=0,0435.

По этим данным строим гистограмму и выравнивающую её нормальную кривую распределения:

*0,3

* *

-4 * * 4

Оценка числовых характеристик случайных величин по ограниченному числу опытов

На практике часто бывает либо заранее известен закон распределения и требуется найти лишь параметры его, либо знание его несущественно, а нужно знать только его некоторые характеристики, когда по ограниченному объёму выборки необходимо производить такие оценки. Как правило, это относится к первым двум моментам.

Постановка задачи следующая.

Предположим, что независимые опыты ещё не произведены, их результаты неизвестны, случайны. Обозначим Xi значение, которое примет случайная величина Х в i-м опыте, а результаты опыта – n независимых случайных величин:

Будем рассматривать их как n «экземпляров» случайной величины Х, каждый из которых имеет тот же закон распределения, что и сама величина Х. Если мы определяем некоторый параметр a по результатам опыта, то его приближённое значение называют оценкой. Любая оценка, вычисляемая на основе экспериментальных данных, является функцией этих случайных величин и значит тоже случайная величина.

Например, для МО естественной оценкой является среднее арифметическое её наблюдённых значений:

Итак, любая оценка параметра является случайной величиной её закон распределения зависит от закона распределения Х и от вида функции , выражающей через , а значит и от числа опытов n. К оценке предъявляются требования обладания рядом свойств:

Состоятельность – оценка приближается при увеличении числа опытов (сходится по вероятности) к искомому параметру

Несмещённость – отсутствие систематической ошибки

Эффективность – наличие минимальной дисперсии по сравнению с другими

На практике не всегда удаётся удовлетворить всем этим требованиям.

Определим и дисперсию

Выше указывалось, что для среднее арифметическое (или статистическое среднее):

Состоятельность этой оценки следует из закона больших чисел, согласно которому при увеличении числа опытов она сходится по вероятности к МО случайной величины Х.

Несмещённость можно показать, найдя её математическое ожидание:

,

т.е.оценка для является несмещённой.

Найдём дисперсию этой оценки:

.

Эффективность оценки зависит от вида закона распределения Х, можно показать, что для нормально распределённой величины оценка для математического ожидания является и эффективной.

Для дисперсии, на первый взгляд, наиболее естественной является статистическая дисперсия , т.е. среднее арифметическое квадратов отклонений значений от среднего:

Для проверки её состоятельности выразим её через статистический второй начальный момент, т.е. через среднее арифметическое квадратов наблюдённых значений:

Первый член в правой части – среднее арифметическое наблюдений случайной величины сходится по вероятности к её МО: Второй член сходится по вероятности к , вся величина по вероятности сходится к Значит оценка состоятельна.

Для проверки её несмещённости выполним следующее:

Так как статистическая дисперсия не зависит от того, где выбрать начало координат, выберем его в точке , т.е. отцентрируем все случайные величины Тогда

Найдём МО величины

Но и эта формула даёт:

Отсюда видно, что величина не является несмещённой оценкой для дисперсии , её МО не равно , а несколько меньше. Чтобы ликвидировать систематическую ошибку, достаточно ввести поправку, умножив на

Тогда для несмещённой оценки для дисперсии получим:

равную статистической дисперсии, умноженной на соответствующий коэффициент. При больших значениях этот множитель становится близким к единице и его можно не применять.

Окончательно, для приближённых оценок имеем:

Вместо последнего выражения часто удобно использовать:

Можно показать, что такой же поправочный множитель нужно вводить и при вычислении несмещённой оценки для ковариации двух случайных величин и

Вопросы для самопроверки

В чём отличие группированного статистического ряда от упорядоченной статистической совокупности

В чём отличие частоты от вероятности

Какие оценки называют состоятельными

Какие оценки называют несмещёнными

Какие оценки называют эффективными

Вопросы к экзаменам

1.Первичная статистическая совокупность, её упорядочение

2. Статистическая функция распределения.

3. Группированный статистический ряд.

4. Гистограмма.

5. Выравнивание статистических распределений.

6. Оценка числовых характеристик случайных величин по ограниченному числу опытов

Именной указатель

Перечень сокращений

9