Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
билеты матан.docx
Скачиваний:
17
Добавлен:
20.09.2019
Размер:
434.09 Кб
Скачать

44. Статистическое распределение выборки. Полигон и гистограмма

При систематизации данных выборочных обследований используются статистические дискретные и интервальные ряды распределения.

1. Статистическое дискретное распределение. Полигон.

Пусть из генеральной совокупности извлечена выборка, причем х1 наблюдалось n1 раз, х2 – n2 раз, хk – nk раз и ∑ni=n - объем выборки. Наблюдаемые значения х1 называют вариантами, а последовательность вариант, записанных в возрастающем порядке – вариационным рядом. Число наблюдений варианты называют частотой, а ее отношение к объему выборки - относительной частотой ni/n=wi

ОПРЕДЕЛЕНИЕ. Статистическим (эмпирическим) законом распределения выборки, или просто статистическим распределением выборки называют последовательность вариант хi и соответствующих им частот ni или относительных частот wi.

Статистическое распределение выборки удобно представлять в форме таблицы распределения частот, называемой статистическим дискретным рядом распределения:

x1 x2 ... xm

n1 n2 ... nm

(сумма всех частот равна объему выборки ∑ni=n)

или в виде таблицы распределения относительных частот:

x1 x2 ... xm

w1 w2 ... wm

(сумма всех относительных частот равна единице ∑wi=1)

Пример 2. Постройте полигон частот и относительных частот по данным примера 1.

Решение: Используя дискретный статистический ряд распределения, составленный в примере 1 построим полигон частот и полигон относительных частот:

  1. Статистический интервальный ряд распределения. Гистограмма. Статистическим дискретным рядом (или эмпирической функцией распределения) обычно пользуются в том случае, когда отличных друг от друга вариант в выборке не слишком много, или тогда, когда дискретность по тем или иным причинам существенна для исследователя. Если же интересующий нас признак генеральной совокупности Х распределен непрерывно или его дискретность нецелесообразно ( или невозможно) учитывать, то варианты группируются в интервалы.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению ni/h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni/h. Площадь i-го частичного прямоугольника равна h•ni/h=ni - сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению wi/h (плотность относительной частоты).

Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии wi/h. Площадь i-го частичного прямоугольника равна h•wi/h=wi - относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

Пример 4. Постройте гистограмму частот и относительных частот по данным примера 3

45.Точечные оценки параметров распределения.

Точечной оценкой характеристики θ называют некоторую функцию   результатов наблюдений, значения которой близки к неизвестной характеристике θ генеральной совокупности.

Точечная оценка математического ожидания.

 Задана случайная величина Хх1, х2, …, хn, так как М(Х) не найти, то для математического ожидания случайной величины Х естественно предложить среднее арифметическое

 

                                               (1.3)

 

её наблюденных значений.

1. По методу произведений 

,

так как

.

Это и означает, что оценка   несмещенная.

2. Если исследуемая случайная величина Х имеет конечную дисперсию, то эта оценка будет состоятельной, так как

.

Если исследуемая величина имеет нормальный закон распределения, то можно показать, что предложенная оценка эффективна, т. е. оценки для математического ожидания с меньшей дисперсией не существует для нормально распределенных величин.

 

Точечная оценка для дисперсии

 

Так как дисперсия определяется через математическое ожидание, а для математического ожидания оценка уже выбрана, то для дисперсии естественно предложить оценку:

 

 или  ;               (1.4)

 

,                 (1.5)

 

что соответствует записи дисперсии в виде  .

Оказывается, что предложенная оценка дисперсии (1.4) состоятельна (легко доказать) и (1.5) не является несмещенной. Чтобы в этом убедиться, возведём в квадрат последнее слагаемое в (1.4)

Процентрируем величину Х, т. е. перенесем начало координат в точку М(Х):  . Дисперсия зависит лишь от разности значений Х и математического ожидания, поэтому от переноса начала координат оценка не изменится и равенство можно продолжить:

.

Вычислим теперь математическое ожидание полученной величины

,

т. е.  , так как  .

Значит, предложенная оценка занижает истинное значение дисперсии.

Для получения несмещенной оценки введем поправку и полученную оценку обозначим через S2

или

 

                                         .                                        (1.6)

 

Оценка S2 (1.6) является состоятельной, так как   сходится по вероятности к М(Х2), а   – к М(Х).

Замечание. При малых n дробь   довольно значительно отличается от единицы, а с увеличением nстремится к единице. При n > 50 практически нет разницы между оценками   и S2Оценки   и S2 являются состоятельными оценками дисперсии