Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по МС.doc
Скачиваний:
5
Добавлен:
29.08.2019
Размер:
507.9 Кб
Скачать

Математическая статистика

§ 1. Основные понятия

Математическая статистика − раздел математики, изучающий математические методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей.

Математическая статистика возникла в 18 веке в работах Я. Бернулли, П. Лапласа, К. Пирсона. В современный период развития математики определяющее значение имели работы Г. Крамера, Р. Фишера, Ю. Неймана. Значительный вклад внесла русская математическая школа в лице П.Л. Чебышева, A.M. Ляпунова, А.Н. Колмогорова, Б.В. Гнеденко.

Математическая статистика опирается на теорию вероятностей. Если теория вероятностей изучает закономерности случайных явлений на основе специальной математической модели (вероятностная модель), то математическая статистика оперирует непосредственно результатами наблюдений над случайными событиями, представляющими выборку из конечной или гипотетически бесконечной генеральной совокупности. Используя результаты, полученные теорией вероятностей, математическая статистика позволяет не только оценить значения искомых характеристик, но и выявить степень точности выводов, получаемых при обработке выборки.

Результаты статистического исследования дают основания для принятия решений в задачах планирования, управления, прогнозирования, организации производства, контроля качества продукции, определения срока службы и надежности деталей. Эти основания опираются на принцип практической уверенности: если вероятность какого-либо события в определенном испытании очень мала, то можно быть уверенным в том, что при однократном испытании оно не произойдет.

Теория вероятностей позволяет выражать вероятности сложных событий через вероятности элементарных событий, а математическая статистика по результатам наблюдений (по выборке) позволяет оценить вероятности случайных событий или осуществить проверку гипотез о значении этой вероятности.

Математическая статистика — это теория принятия решений в условиях неопределенности.

§ 2 Выборочный метод

Пусть требуется изучить некоторую совокупность однородных объектов относительно количественного признака, характеризующего эти объекты (вес, длина, прочность, срок службы, стоимость и т.п.).

Способ, позволяющий по результатам изучения части объектов сделать вывод обо всей совокупности объектов, называется выборочным методом статистического исследования, который можно охарактеризовать следующими последовательными шагами: 1) из некоторой совокупности объектов извлекается их часть (выборка); 2) у всех объектов выборки определяется некоторый количественный признак; 3) полученные числовые значения выписывают в порядке возрастания (ранжируют) и определяют частоту (повторяемость) значений признака; 4) эти числовые данные представляются в графическом виде (полигон, гистограмма, эмпирическая функция распределения); 5) вычисляются числовые характеристики полученного ряда числовых значений (среднее, дисперсия, мода, медиана, размах, начальные и центральные моменты, асимметрия и эксцесс).

Четвертый шаг позволяет предположить вид закона распределения количественного признака, а пятый − определить параметры предполагаемого закона распределения.

Определение. Генеральной совокупностью называют совокупность объектов, подлежащих изучению с точки зрения некоторого количественного признака. Количество таких объектов называют объемом генеральной совокупности.

Определение. Выборочной совокупностью или выборкой называется совокупность случайно (!) отобранных из генеральной совокупности объектов. Количество таких объектов называют объемом выборки.

Определение. Ряд числовых значений называют ранжированным, если все значения располагаются в порядке неубывания.

Определение. Значения , которые принимает случайная величина в результате эксперимента, называют вариантами этой случайной величины.

Определение. Последовательность значений случайной величины , полученная в результате ранжирования, называется вариационным рядом.

Пример. В результате измерения некоторой величины были получены следующие числа:

42,02; 56,45; 58,61; 28,69; 57,43; 25,95; 36,51; 46,81; 46,61; 52,28; 50,94; 38,55; 63,98; 64,26; 78,09; 48,94; 44,41; 22,93; 42,24; 39,79; 35,98; 57,46; 13,22; 47,91; 50,33; 69,37; 46,57; 63,13; 58,75; 41,36; 23,75; 36,42; 45,19; 43,15; 61,76; 55,28; 57,60; 54,91; 47,73; 60,69; 66,35; 47,93; 38,90; 38,61; 40,51; 49,11; 63,35; 44,72; 53,95; 50,42

Построить вариационный ряд.

Решение.

13,22; 22,93; 23,75; 25,95; 28,69; 35,98; 36,42; 36,51; 38,55; 38,61; 38,90; 39,79; 40,51; 41,36; 42,02; 42,24; 43,15; 44,41; 44,72; 45,19; 46,57; 46,61; 46,81; 47,73; 47,91; 47,93; 48,94; 49,11; 50,33; 50,42; 50,94; 52,28; 53,95; 54,91; 55,28; 56,45; 57,43; 57,46; 57,60; 58,61; 58,75; 60,69; 61,76; 63,13; 63,35; 63,98; 64,26; 66,35; 69,37; 78,09.

Определение. Числа , показывающие сколько раз встречаются (повторяются) варианты в вариационном ряду, называются частотами. Их отношение к общему числу наблюдений (объем выборки) − относительными частотами , т.е. , где .

Определение. Список вариантов и их частот называется статистическим распределением выборки или статистическим рядом.

Статистическое распределение выборки является оценкой (приближением) неизвестного закона распределения вероятностей и записывается в виде таблицы, в которой первая строка содержит варианты случайной величины, а вторая строка − их частоты. Если же случайная величина непрерывная или дискретная с большим количеством вариант, то составляют интервальный статистический ряд, который также записывается в виде таблицы из двух строк. В первую строку записывают частичные промежутки , которые обычно берут одинаковой длины , где − количество интервалов. За начало первого интервала берут , а (для того, чтобы это неравенство выполнялось необходимо всегда округлять с избытком, в противном случае не все варианты попадут в промежутки). Во вторую строку записывают частоты попадания вариант в данный частичный промежуток.

Пример. Составить статистический ряд по вариационному ряду из предыдущего примера.

Решение.

Найдем длины частичных промежутков. Поскольку , , (округляем до ближайшего целого числа), то (округляем с избытком).

Промежуток

1

4

8

16

12

7

2

Контроль: .

Определение. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами в дискретном случае и точки с координатами в непрерывном случае, где − середина частичного промежутка .

Определение. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные промежутки длины , а высоты равны отношению частоты и длины частичного промежутка , т.е. − плотность частоты.

!!!Аналогично последним трем понятиям определяются понятия полигона, гистограммы относительных частот. Как статистический ряд является оценкой (приближением) закона распределения для дискретной случайной величины, так гистограмма является оценкой (приближением) дифференциальной функции распределения (плотности вероятности).

Пример. По статистическому ряду предыдущего примера построить полигон и гистограмму.

Решение. Так как гистограмма применяется для графической интерпретации статистического ряда непрерывной случайной величины, а полигон для статистического ряда дискретной случайной величины, то по первому статистическому ряду предыдущего примера построим полигон, а по второму − гистограмму.

Если взять для каждого из частичных промежутков его середину, то второй статистический ряд можно переписать в том виде, который позволяет построить полигон для данного непрерывного признака.

17,86

27,14

36,42

45,7

54,98

64,26

73,54

1

4

8

16

12

7

2

Для построения гистограммы по второму статистическому ряду составим следующую таблицу (число было найдено выше):

Промежуток

1

4

8

16

12

7

2

0,11

0,43

0,86

1,72

1,29

0,75

0,22

Рассмотрим теперь следующий шаг выборочного метода, а именно, вычисление числовых характеристик выборки, которые аналогичны числовым характеристикам случайных величин в теории вероятностей.

Определение. Выборочным средним называется среднее арифметическое всех значений выборки: или , где − количество различных вариант (количество частичных промежутков).