Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Penina_G.G._Uzbek_E.K._Teoriya_veroyatnostey_i_....doc
Скачиваний:
16
Добавлен:
21.11.2018
Размер:
5.77 Mб
Скачать

5. Закон больших чисел

Принцип практической уверенности

Если в определенных условиях вероятность события очень мала, то при однократном их выполнении можно быть уверенным в том, что это событие не произойдет, и в практической деятельности поступать так, как будто оно является невозможным. Вероятность, которой решено

пренебрегать в одном исследовании, называется уровнем значимости. В статистике обычно рекомендуется пользоваться уровнем значимости 0,05 при предварительных исследованиях и 0,01 при окончательных выводах.

Под законом больших чисел понимается совокупность положений, в которых утверждается, что с вероятностью, как угодно близкой к единице, выполняются определенные соотношения.

Неравенство

Чебышева

Вероятность того, что отклонение случайной величины от ее математического ожидания по абсолютной величине меньше положительного числа , не меньше разности между единицей и дробью, числитель которой – дисперсия случайной величины , а знаменатель – квадрат

.

Теорема

Чебышева

Если дисперсии попарно независимых случайных величин ограничены одной и той же постоянной , а число их достаточно велико, то как бы ни было мало положительное число , вероятность того, что отклонение средней арифметической этих случайных величин от средней арифметической их математических ожиданий меньше по абсолютной величине , будет как угодно близка к единице

.

Другими словами, среднее арифметическое достаточно большого числа независимых случайных величин утрачивает характер случайной величины. На теореме Чебышева основан выборочный метод в статистике, суть которого состоит в том, что по сравнительно небольшой случайной выборке судят о всей генеральной совокупности исследуемых объектов.

Теорема Бернулли

Если в каждом из независимых испытаний вероятность появления события постоянна, то как угодно близка к единице вероятность того, что отклонение относительной частоты от вероятности по абсолютной величине будет сколь угодно малым, если число испытаний достаточно велико

.

Другими словами, частость приближается при большом числе испытаний к вероятности.

Закон больших чисел лежит в основе различных видов страхования (страхование жизни человека на всевозможные сроки, имущества и др.) При планировании ассортимента товаров широкого потребления учитывается спрос на них населения. В этом спросе проявляется действие закона больших чисел. Сумма конечного числа независимых нормально распределенных случайных величин распределена по нормальному закону.

VI. Элементы математической статистики

1. Характеристики распределения опытных данных

Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Вся подлежащая изучению совокупность объектов называется генеральной совокупностью.

Та часть объектов, которая попала на проверку, называется выборочной совокупностью или выборкой. Число элементов совокупности называется ее объемом. Наблюдаемые значения количественного признака называются вариантами. Последовательность вариант, записанных в возрастающем порядке, называют вариационным рядом. Число наблюдений значения называется частотой варианты . Отношение частоты к объему выборки называется относительной частотой или частостью.

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.

Эмпирической функцией распределения называют функцию , определяющую для каждого значения относительную частоту события

,

– число наблюдений, при которых наблюдалось значение признака ,

меньшее ,

– общее число наблюдений (объем выборки).

эмпирическая функция статистического распределения является аналогом интегральной функции случайной величины .

Полигоном частот называют ломаную, отрезки которой соединяют точки .

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки .

В случае непрерывного статистического распределения строят гистограмму. Гистограммой частот называют фигуру, являющуюся совокупностью прямоугольников, основания которых равны длинам интервалов , а высоты равняются плотности частоты (т.е. отношению ). Гистограмма относительных частот строится в соответствии с плотностями относительных частот.

Площадь гистограммы относительных частот равна единице. Это свойство идентично свойству вероятностей событий, образующих полную группу.

Накопленные частоты – это результаты последовательного суммирования частот всех вариант (или частот интервалов), включая частоту данного варианта (или интервала). Накопленные частоты показывают число членов совокупности, для которых признак не превышает данного значения.

Кумулятивная кривая – это ломаная линия, отрезки которой соединяют точки .

Средние величины рассматриваются в статистике как обобщающие показатели, в которых находят выражение действие общих для данного явления условий. Основной средней величиной является среднее арифметическое или выборочное среднее.

Выборочным средним называют среднее арифметическое значение признака выборочной совокупности

.

Свойства выборочного среднего:

  1. .

  2. ,

или

.

Медиана – это варианта, которая делит вариационный ряд на две части, равные по числу вариант.

Для дискретного вариационного ряда:

Для интервального вариационного ряда:

,

где – медианный интервал, который выбирают по срединному значению,

– объем выборки,

– частота медианного интервала,

– сумма частот интервалов, предшествующих медианному.

Модой называют значение варианты, имеющее наибольшую частоту.

Для дискретного вариационного ряда мода определяется непосредственно сравнением частот.

Для интервального вариационного ряда

,

где – модальный интервал с наибольшей частотой,

– частота модального интервала,

– частота интервала, предшествующего модальному,

– частота интервала, следующего за модальным.

Показатели вариации

Вариация индивидуальных значений признака является атрибутивным свойством явления. В ней выражается то влияние множества случайностей, которое характерно для исследуемого явления. Показатели вариации вместе со средними величинами представляют тот фундамент, на который опирается математико-статистический анализ..

Размах вариации (или ее амплитуда) – это разность между наибольшим и наименьшим значениями признака

.

Среднее абсолютное или среднее линейное отклонение – это взвешенное частотами среднее из абсолютных отклонений вариант ряда от выборочного среднего

.

Выборочной дисперсией называют среднее арифметическое квадратов отклонений наблюдаемых значений признака от их среднего значения

или

,

где .

Средним квадратическим отклонением называют корень квадратный из дисперсии .

Линейный коэффициент вариации – это относительная характеристика степени колеблемости значений признака

.

Коэффициент вариации служит для сравнения величин рассеяния двух вариационных рядов: тот из рядов имеет большее рассеяние, у которого коэффициент вариации больше.

Пример 17.

Провести анализ статистического распределения выборки работников цеха по производительности труда (количество изготавливаемых за смену деталей)

18

20

22

24

1

2

6

1

Р ешение. Объем выборки .

Полигон частот имеет вид:

Эмпирическая функция распределения

Выборочное среднее:

.

Медиана:

– четное число,

, .

.

Найдем накопленные частоты

18

20

22

24

1

2

6

1

1

3

9

10

Начиная с четвертой по девятую, варианты имеют значение, равное 22. Следовательно, и .

.

Мода:

наибольшая частота соответствует варианте 22.

.

Размах вариации:

.

Среднее абсолютное отклонение:

.

Выборочная дисперсия:

,

.

Среднее квадратическое отклонение:

.

Коэффициент вариации:

.

Пример 18.

Построить полигон частот, определить моду и медиану интервального статистического распределения выборки колосьев пшеницы по их длине (мм).

0 – 2

2 – 4

4 – 6

6 – 8

8 – 10

10 – 12

133

237

373

362

270

125

Решение.

Объем выборки:

.

Полигон построим по серединам интервалов распределения:

Н айдем накопленные частоты:

0 – 2

2 – 4

4 – 6

6 – 8

8 – 10

10 – 12

133

237

373

362

270

125

133

370

743

1105

1375

1500

Медиана:

, .

(6; 8) – медианный интервал.

, .

, .

.

Мода:

наибольшая частота определяет модальный интервал (4;6).

, .

, , .

.