Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный морской технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекция 1_ статистика.doc

Скачиваний:

Добавлен:

18.04.2015

Размер:

372.22 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 33

Эмпирическая функция распределения

Пусть известно статистическое распределение признака , т.е. построен вариационный ряд для выборки объема. Пусть–число вариант, приходящихся на интервал. Относительная частота событияравна.

Эмпирической функцией распределения (функцией распределения выборки) называется функция , определяющая для каждого значенияотносительную частоту события, т.е.. Из теоремы Бернулли следует, что относительная частота события, т.е., стремится по вероятности к вероятности этого события:для любого. Это означает, что функцииимало отличаются друг от друга при больших значениях.

Функция обладает всеми свойствами функции.:

1) , 2)– неубывающая функция, 3)при,при. Эмпирическая функция распределения приближенно представляет собой теоретическую функцию распределения.

В примере 1

Статистические оценки параметров распределения

Наиболее существенными параметрами распределения являются математическое ожидание и дисперсия распределения. Статистические оценки параметров распределения называются статистиками.

Статистической оценкой математического ожидания является среднее арифметическое или среднее выборочное

., (1)

где ,,. (2)

Свойства среднего арифметического

Действительно, .

2) .

3) Сумма отклонений всех вариант от их среднего арифметического равна нулю:

4) Сумма квадратов отклонений вариант от их среднего арифметического меньше суммы квадратов их отклонений от любого другого числа

Доказательство

При выводе этого соотношения было учтено равенство =0 и неравенство.

Медиана или срединное значение – значение признака, для которого накопленная относительная частота равна 0.5. При наличии сгруппированных данных для отыскания медианы нужно определить интервал, для нижней границы которого значение накопленной относительной частоты меньше 0.5, а для верхней границы больше 0.5. Середина этого интервала принимается за медиану.

Мода – значение признака, соответствующее максимуму теоретической кривой. За моду принимают середину модального интервала – интервала с наибольшей частотой. Мода– абсцисса наивысшей точки полигона. Модальный интервал соответствует наивысшей ступени гистограммы.

Пример 1. –средняя оценка на экзамене. ,

Пример 2. . Модальный интервал[115;120].

Статистическая дисперсия

В качестве меры разброса вариант относительно среднего значения вводят статистическую дисперсию

. (3)

Вообще говоря, статистическую дисперсию нужно вводить как сумму квадратов отклонений вариант от математического ожидания случайной величины, т.е.

(4)

Но поскольку неизвестно, то в качестве статистической дисперсии используют определение (3). Однако при этом происходит занижение оценки дисперсии, т.е. статистическая дисперсия является смещенной оценкой дисперсии генеральной совокупности. Для исправления этой ошибки нужно в формуле (3) заменитьна. Поэтому для оценки дисперсии генеральной совокупности используютисправленную статистическую дисперсию

, (5)

которая является несмещенной оценкой дисперсии генеральной совокупности. Если велико, то формулы (3) и (5) дают практически один и тот же результат. В случаедля вычисления статистической дисперсии используют формулу (5).