Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Презентации по математике / Лекции 2 семестр / Элементы мат.статистики.doc
Скачиваний:
247
Добавлен:
11.02.2015
Размер:
2.3 Mб
Скачать

Элементы математической статистики Тема: «Выборочный метод и оценка генеральных параметров» Лекция №1 по теме: «Генеральная совокупность и выборка. Графическое представление вариационных рядов.»

Наблюдения над биологическими объектами могут охватывать все члены изучаемой совокупности без единого исключения или ограничиваться обследованием лишь некоторой части членов данной совокупности. В первом случае наблюдения называют полными или сплошными, во втором — частичными или выборочными. Полное обследование совокупности позволяет получать исчерпывающую информацию об изучаемом объекте, в чем и заключается преимущество этого способа перед способом выборочного наблюдения. Однако к сплошному наблюдению прибегают редко, так как эта работа сопряжена с большими затратами времени и труда, а также в силу практической невозможности или нецелесообразности проведения такой работы. Невозможно, например, учесть всех обитателей зоо- или фитопланктона даже небольшого водоема, потому что их численность практически необозрима. Нецелесообразно высевать всю партию семян для того, чтобы определить их всхожесть. В подавляющем большинстве случаев вместо сплошного наблюдения изучению подвергают некоторую часть обследуемой совокупности, по которой и судят о ее состоянии в целом.

Совокупность, из которой отбирают определенную часть ее членов для совместного изучения, называют генеральной. Отобранная тем или иным способом часть генеральной совокупности получила название выборочной совокупности или выборки. Общую сумму членов генеральной совокупности называют ее объемом и обозначают буквой N. Теоретически объем генеральной совокупности ничем не ограничен, т. е. генеральную совокупность представляют как бесконечно большое множество относительно однородных единиц или членов, составляющих ее содержание. Практически же объем генеральной совокупности всегда ограничен и может быть различным в зависимости от объекта наблюдения и той задачи, которую приходится решать. Например, при определении продуктивности животных той или иной породы или вида генеральную совокупность составят все особи данной породы или вида. Если же вопрос о продуктивности животных решают в зоне данной области или района, то генеральную совокупность составят все животные изучаемой породы, распространенной в данной области или районе.

Объем выборки, обозначаемый буквой п, может быть и большим, и малым, но он не может содержать менее двух единиц. Выборочный метод — основной при изучении статистических совокупностей. Его преимущество перед полным учетом всех членов генеральной совокупности заключается в том, что он сокращает время и затраты труда (за счет уменьшения числа наблюдений), а главное — позволяет получать информацию о таких групповых объектах, сплошное обследование которых практически невозможно или нецелесообразно.

Основное требование, предъявляемое к любой выборке, сводится к получению наиболее полной информации о состоянии генеральной совокупности, из которой выборка взята. Опыт показал, что правильно отобранная часть генеральной совокупности, т.е. выборка, довольно хорошо отображает структуру генеральной совокупности. Однако полного совпадения выборочных показателей с характеристиками генеральной совокупности, как правило, не бывает. Чтобы выборка наиболее полно отображала структуру генеральной совокупности, она должна быть достаточно представительной, или репрезентативной. Репрезентативность выборки достигается способом рандомизации (от англ. random — случай) или случайным отбором вариант из генеральной совокупности, что обеспечивает равную возможность для всех членов генеральной совокупности попасть в состав выборки.

Существует два основных способа отбора вариант из генеральной совокупности: повторный и бесповторный. Повторный отбор производят по схеме «возвращения» учтенных единиц в генеральную совокупность, так что одна и та же единица может попасть в выборку повторно. При бесповторном отборе учтенные единицы не возвращаются в генеральную совокупность, каждая отобранная единица регистрируется только один раз. Повторный отбор не влияет на состав генеральной совокупности, и возможность каждой единицы попасть в выборку не меняется. При бесповторном отборе возможность единиц, составляющих генеральную совокупность, попасть в выборку меняется, так как каждый предшествующий отбор влияет на результаты последующего, а также и на состав генеральной совокупности, который тоже претерпевает изменения. В практике обычно применяют бесповторный случайный отбор. Так, если измеряют рост мужчин призывного возраста, то, измерив одного из них, вторично его уже не измеряют. Случайный повторный отбор служит теоретической моделью, с помощью которой изучают процессы, совершающиеся в статистических совокупностях, что имеет определенное познавательное значение.

Идеальный случайный отбор производится по методу жеребьевки или лотереи, а также с помощью таблицы случайных чисел.

Наряду с простым случайным отбором в практике применяют и другие виды выборки из генеральной совокупности. К ним относится типический, серийный и механический отбор. Типический отбор используют в тех случаях, когда генеральная совокупность расчленяется на отдельные (типические) группы. Например, в хозяйстве среди крупного рогатого скота находятся первотелки, группы коров по второму, третьему и другим отелам. В таких случаях из каждой группы случайным способом отбирают одинаковое, а чаще пропорциональное число единиц. Затем вычисляют групповые характеристики, объединяемые в общую характеристику генеральной совокупности.

При серийном отборе, как и при типическом, генеральную совокупность предварительно делят на группы (серии, гнезда), образуемые обычно по территориальному принципу. Затем по усмотрению исследователя из общего количества серий или гнезд отбирают некоторое их число для совместной обработки. При этом серии могут быть как равночисленными, так и состоять из разного числа единиц. Например, из 30 групп подростков в возрасте от 14 до 15 лет намечено обследовать выборочно шесть групп. Членов этих групп и объединяют для совместного изучения. Таким образом, в отличие от типического отбора при серийной выборке из генеральной совокупности извлекают не отдельные единицы, а целые серии или гнезда относительно однородных единиц.

При механическом отборе генеральная совокупность разбивается на несколько равных частей или групп. Затем из каждой группы случайным способом отбирают по одной единице. Например, при обследовании посева ржи на урожайность намечено отобрать 100 растений (или колосьев). В таком случае поле ржи должно быть разбито на сто равных делянок. Следовательно, при механическом отборе число единиц равно численности групп, на которые разбита генеральная совокупность.

Графическое представление статистических рядов

Для случая, когда количественный признак является дискретной величиной, его значения хi и соответствующие им частоты ni или относительные частоты wi представляют в виде таблицы, в которой значения признака (варианты) располагаются в порядке возрастания.

, где ni - это число повторений варианта

Такие таблицы называют статистическим дискретным рядом распределения или дискретным вариационным рядом.

Хi

Х1

Х2…

Хk

wi

w1

w2…

wk

Графически статистические ряды могут быть представлены в виде полигона, гистограммы или графика накопленных частот.

Полигоном частот называют ломаную линию, отрезки которой соединяют точки (xi, ni).

Полигоном относительных частот называют ломаную линию, отрезки которой соединяют точки (xi, i)

Полигоны обычно служат для изображения выборки в случае дискретной случайной величины.

Пример. В результате измерения температуры у 12 животных получены следующие значения: 37,8; 37,8; 38; 37,7; 37,9; 37,8; 37,5; 37,7; 37,6; 38; 38,1; 37,9. Требуется построить вариационный ряд и соответствующий ему полигон.

Решение. Проанализируем исходные данные. Значение температуры

t = 37,8 у животных наблюдалось три раза; значение температур t = 37,7;

t = 37,9; t = 38 — по два раза; значение температур t = 37,5; t = 37,6; t = 38,1 — по одному разу. Исходя из этого, строим вариационный ряд:

xi

37,5

37,6

37,7

37,8

37,9

38

38,1

ni

1

1

2

3

2

2

1

Ему соответст­вует полигон частот( рис. 1 )

Рис. 1 Полигон частот

В случае большого количества вариантов и непрерывного распределения признака статистическое распределение признака можно задать в виде последовательности интервалов и соответствующих им частот или относительных частот. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на определенное количество частных интервалов (x0; x1]; (x1; x2]; …; (xk-1; xk] длиной h и находят для каждого частичного интервала сумму частот вариант .

Для графического изображения интервального ряда распределения используют гистограммы.

Гистограмма относительных частот (или просто гистограмма) - ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны i /h (или i) . Площадь гистограммы равна единице.

f*=-плотность относительных частот.

- длина соответствующего интервала

К=1+3,32ּlg(n) - количество классов (интервалов)

Пример. У 30 коров измеряли окружность локтевого сустава. Получены следующие результаты измерений:

(26;28]

(28;30]

(30;32]

(32;34]

(34;36]

(36;38]

2

5

11

8

3

1

0,03

0,08

0,18

0,13

0,05

0,02

Для нашего примера . Данному вариационному ряду будет соответствовать гистограмма ( рис. 2 )

Рис. 2 Гистограмма плотности относительных частот

Гистограмму можно рассматривать как график эмпирической (выборочной) плотности распределения fi (x). Если у теоретического распределения F существует конечная плотность, то эмпирическая плотность является некоторым приближением для теоретической. В этом и состоит практическая польза гистограммы.

Графиком накопленных частот называется фигура, строящаяся аналогично гистограмме с той разницей, что для расчета высот прямоугольников берутся не простые, а накопленные относительные частоты, т.е. . Эти величины не убывают, и таким образом график накопленных частот имеет вид ступенчатой “лестницы” (от 0 до 1).

График эмпирической функции распределения проходит через правые верхние углы прямоугольника.

График накопленных частот и эмпирическая функция распределения на практике используется для приближения теоретической функции распределения.

Пример: Дан сгруппированный ряд наблюдений

Номер интервала

Интервал

Середина интервала

1

5,05-5,15

5,1

0,05

0,05

2

5,15-5,25

5,2

0,08

0,13

3

5,25-5,35

5,3

0,12

0,25

4

5,35-5,45

5,4

0,2

0,45

5

5,45-5,55

5,5

0,26

0,71

6

5,55-5,65

5,6

0,15

0,86

7

5,65-5,75

5,7

0,1

0,96

8

5,75-5,85

5,8

0,04

1


Требуется построить гистограмму и график накопленных частот.

Рис.3. Гистограмма относительных частот.

Рис.4.График накопленных частот (кумулята)