Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
В.В.Нешитой МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА.DOC
Скачиваний:
26
Добавлен:
16.11.2019
Размер:
4.6 Mб
Скачать

5.2. Статистическое распределение выборки. Полигон. Гистограмма. Эмпирическая функция распределения

Статистическое распределение выборки – это соотношение между значениями вариант и соответствующими им частотами или частостями (относительными частотами) .

Статистическое распределение выборки можно представить в виде таблицы, в первую строку которой записываются варианты, а во вторую – соответствующие им частоты или частости.

xi

x1

x2

xk

mi

m1

m2

mk

wi

w1

w2

wk

Здесь сумма всех частот равна объему выборки n, т.е.

,

а сумма частотей равна единице

.

Для непрерывного вариационного ряда составляется таблица, в первой строке которой указываются интервалы изменения вариант, а во второй – частоты.

хi

х1–х2

х23

mi

m1

m2

Дискретные распределения можно представить полигоном, непрерывные – гистограммой.

Весь вариационный ряд с размахом разбивают на несколько интервалов и подсчитывают число точек (частоту) на каждом интервале. Затем на каждом интервале строится прямоугольник, площадь которого равна относительной частоте интервала. Вся площадь гистограммы в этом случае равна единице.

Г истограмма Полигон

Эмпирической функцией распределения случайной величины Х называется функция

,

где mx – число вариант, меньших х; n – объем выборки.

Эмпирическая функция распределения является оценкой функции распределения F(x)=P(X<х).

5.3. Статистические оценки параметров. Точность оценки, доверительная вероятность (надежность)

Выборку характеризуют такие показатели, как:

  • среднее выборочное значение

(n – объем выборки);

  • выборочная дисперсия

;

  • центральные выборочные моменты

(все характеристики приведены для несгруппированных данных).

Выборочная дисперсия является смещенной оценкой генеральной дисперсии. Несмещенной оценкой дисперсии будет исправленная выборочная дисперсия

.

При объеме выборки n > 30 можно использовать неисправленную выборочную дисперсию.

Среднее выборочное значение является точечной оценкой математического ожидания.

Если установить границы интервала , который с заданной вероятностью Р покрывает значение , то получим интервальную оценку.

Пусть 1– обозначает вероятность того, что результат измерения отличается от истинного значения mx на величину, не большую . Это записывается так:

,

где 1– - доверительная вероятность (надежность) оценки; доверительный интервал.

Величина  характеризует точность оценки (в данном случае среднего) и по абсолютной величине равна

,

где – среднеквадратическое отклонение; n – объем выборки.

Тогда предыдущую формулу можно переписать в виде

.

Величину 1– обычно выбирают 0,9; 0,95; 0,99.

Величину tn находят по таблице распределения Стьюдента в зависимости от числа степеней свободы ν = n и вероятности α.