Добавил:
researchgate.net Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

978-966-10-2413-6_Matematuka 11_rus

.pdf
Скачиваний:
25
Добавлен:
24.03.2018
Размер:
10.66 Mб
Скачать

Элементы комбинаторики

 

 

 

 

 

 

 

 

441

 

 

Итог

 

 

 

 

 

 

 

 

 

Основные понятия

 

 

 

 

 

 

 

 

 

 

 

 

Определение

Формулы для вычисления

 

Упорядоченные выборки без

r

= n(n −1)(n − 2)...(n r +1),

 

 

возвращения из п элементов

An

 

 

по r (r n) называют разме-

r n

 

 

 

 

 

 

 

 

щениями из п элементов по r.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Упорядоченные выборки без

n

= n!

 

 

 

 

 

 

возвращения из п элементов

An

 

 

 

 

 

 

по п называют перестановка-

 

 

 

 

 

 

 

 

 

 

 

ми из п элементов.

 

 

 

 

 

 

 

 

 

 

 

Неупорядоченные выборки без

Cr

=

 

n!

 

 

= n(n −1)...(n r + 1) ,

 

 

возвращения из п элементов

n

 

r!(n r)!

 

r!

 

 

по r (r n) называют сочета-

r n

 

 

 

 

 

 

 

 

 

 

 

 

ниями из п элементов по r.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Основные утверждения

 

 

 

 

 

 

 

 

 

 

Если объект А1 может быть выбран n1

раз-

 

Общее

комбинатор-

 

личными способами, объект А2 n2

раз-

ное правило умноже-

 

 

личными способами и т. д., объект Аk

nk

 

ния.

 

 

 

различными способами, то k объектов А1,

 

 

 

 

 

 

 

А2, ..., Аk можно выбрать n1 n2 . . . nk

 

 

 

 

 

 

 

способами.

 

 

 

 

 

 

 

 

 

 

 

Если некоторый объект А можно выбрать

Комбинаторное пра-

 

 

m способами, а другой объект В можно вы-

вило сложения.

 

 

брать n способами, причем ни один из спо-

 

 

 

 

 

 

 

собов выбораАне совпадает с каким-то спо-

 

 

 

 

 

 

 

собом выбора В, то выбор «А или В» можно

 

 

 

 

 

 

 

осуществить m + n способами.

 

 

 

 

 

 

 

 

 

 

 

Если объект А можно выбрать m способа-

 

Общее

комбинатор-

 

 

ми, а объект В n способами, причем при

ное правило сложе-

 

 

k способах одновременно выбираются и А,

 

ния.

 

 

 

и В, то выбор «А или В» можно осущест-

 

 

 

 

 

 

 

вить m + n k способами.

 

 

 

 

 

 

 

 

 

 

§22. Выборочный метод в статистике

Исследовать большую совокупность объектов, о которой необходимо получить информацию, часто нет возможности. Приходится удовлетвориться исследованием ее части – выборки. В данном параграфе дается представление о задачах статистики, о сущности выборочного метода, приводятся примеры его применения.

1. Чем занимается статистика?

Краткий ответ на поставленный вопрос будет та- ким: она учит собирать, регистрировать, изобра- жать, воспринимать, применять информацию.

статистика» имеет один корень со словом «state» (государство) и сначала оно означало искусство и науку управления. Потом слово “статистика” ста - ло означать сбор данных о государстве, а теперь — вообще сбор и обработку данных.

Основными методами для сбора информации является опрос, наблюдение, проведение экспериментов, использование бумаж- ных, электронных источников информации и т. п. Чтобы школе получить информацию о результатах проведения внешнего неза- висимого оценивания (ВНО) можно провести опрос выпускников. Если необходимо иметь информацию о спросе на различные сорта хлеба, целесообразно провести соответствующие наблюдения. В случае необходимости определить различие в стилях двух писате- лей целесообразно, например, определить количества различных слов в отрывках одинаковой длины из произведений этих писате- лей. Подобные примеры можно продолжить.

Информация, собранная одним из указанных методов, обычно бывает хаотичной, неудобной для ее анализа. Например, резуль- таты ВНО сначала могут иметь такой вид (в баллах):

Выборочный метод в статистике

443

153, 130, 169, 146, 121, 157, 128, 185, 135, 149, 125, 140, 185, 123, 162, 162, 130, 169, 130, 125, 180, 162, 135, 128, 123, 135, 128, 157, 130, 172.

Такие результаты мы могли получить, если опрашивали вы- пускников в случайном порядке или результаты разместили в алфавитном порядке выпускников. Чтобы приступить к анализу этой информации, целесообразно упорядочить полученные дан- ные (по возрастанию или убыванию), одинаковые данные не по- вторять. Это можно сделать с помощью таблицы.

Таблица 53

хі 121 123 125 128 130 135 140 146 149 153 157 162 169 172 180 185

пі 1 2 2 3 4 3 1 1 1 1 2 3 2 1 1 2

В первой строке таблицы стоят различные результаты тести- рования. Их обычно называют вариантами. Числа во второй строке показывают, сколько раз встречается соответствующая ва- рианта в совокупности данных. Их называют частотами вари- ант. Общее количество данных п в совокупности (в рассмотренном примере п = 30) называет объемом совокупности. Приведен- ная таблица, то есть упорядоченная совокупность вариант с их частотами, называется вариационным рядом. В этом примере варианты заданы в виде конкретных чисел. Такой вариационный ряд называется дискретным. Если значения величины заданы в виде интервалов, то такой вариационный ряд называется ин- тервальным. По данным таблицы 53 можно построить следую- щий интервальный вариационный ряд.

Таблиця 54

 

 

 

 

 

хі

100–125

126–150

151–175

176–200

пі

5

13

9

3

Относительной частотой варианты хі (интервала)

называется отношение частоты пі этой варианты (ин- тервала) к объему п совокупности данных. Например, отно-

сительная частота варианты 130 равна 304 ≈ 0,133, а относитель-

ная частота интервала 151 – 175 равна 309 = 0,3 .

Будем обозначать относительную частоту варианты хі через nі:

νi = nni .

444 Раздел7.Элементытеориивероятностей иматематическойстатистики

Варианта — от латинского varians (variantis) —

переменный, тот, который изменяется.

Как мы видели, собранную информацию удобно представлять в виде таблиц. Из таблиц 53 и 54 можно сделать первые выводы об успеваемости выпускников: 10% выпускников набрали не бо- лее 125 баллов, 10% — более 175 баллов. Возникает естественный вопрос: соответствуют ли эти результаты успеваемости учеников в школе? Следовательно, статистическая информация стимулиру- ет последующие исследования.

Рассматриваются еще так называемые кумуля- тивныевариационные ряды.Втакихрядахвместо частот (или относительных частот) определенных вариант (или интервалов) записаны накопленные

частоты — числа, равные количеству данных, не превышающих соответствующей варианты (если ряд дискретный) или верхней границы интервала (если ряд интервальный) — или накоплен- ные относительные частоты. В таблицах 55 и 56 представлены ку- мулятивные вариационные ряды, построенные по данным, при- веденным в таблицах 53 и 54.

Таблица 55

хі

пі

Накоплен- ные частоты

хі пі

Накоплен- ные частоты

121

123

125

128

130

135

140

146

149

153

157

162

169

172

180

185

1

2

2

3

4

3

1

1

1

1

2

3

2

1

1

2

1

3

5

8

12

15

16

17

18

19

21

24

26

27

28

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 56

100–125

126–150

151–175

176–200

5

 

13

 

9

 

3

 

5

 

18

 

27

 

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

99 Контрольные вопросы

1.Верно ли, что в интервальных вариационных рядах теряется информация?

Вкаких пределах находится значение частоты варианты?

Вкаких пределах находится значение относительной частоты варианты?

Выборочный метод в статистике

445

4°. Можно ли относительную частоту варианты выразить в про- центах?

5. Какую накопленную частоту имеет наибольшая варианта со- вокупности, упорядоченной по возрастанию?

2. Графическое изображение вариационных рядов

Графическое изображение зависимости между вели- чинами придает ей необходимую наглядность, кон- кретность. Графики могут быть определенной осно- вой для открытия новых свойств, соотношений, закономерностей.

Наиболее употребительными графиками для изображения вариационных рядов, то есть соотношений между вариантами и соответствующими частотами или относительными частотами,

являются полигон и гистограмма.

Полигон частот (или многоугольник частот) использу-

ется чаще всего для изображения дискретных рядов. Для построе- ния полигона в прямоугольной системе координат на оси абсцисс в произвольно выбранном масштабе откладываются варианты, а на оси ординат также в произвольно выбранном масштабе — значения их частот или относительных частот. Масштаб выби- рается такой, чтобы была обеспечена необходимая наглядность и чтобы рисунок имел желательные размеры. Далее в этой си- стеме координат строятся точки, координаты которых являются парами соответствующих чисел из вариационного ряда. Получен- ные точки последовательно соединяются отрезками.

Полигон — от греческого polugwnoz (pjlygonos) —

многоугольный, от polo (poly) — много и gwnia (gonia) —

угол.

 

Если полигон строится по данным интервального ряда, то за

абсциссы точек берут середины соответствующих интервалов.

Пример 1.

Построить полигон частот по данным таблицы 53.

Строим в прямоуголь-

ной системе координат точ-

ки с координатами (хі, пі) и

соединяем полученные точ-

ки отрезками.

Полученный

полигон частот представлен

на рис. 357. g

 

446 Раздел7.Элементытеориивероятностей иматематическойстатистики

Гистограмма (столбчатая диаграмма) применяется для изо- бражения интервальных рядов. Для построения гистограммы по данным вариационного ряда, как и для построения полигона, на оси абсцисс откладываются интервалы вариант, а на оси орди- нат — значения частот или относительных частот. Далее стро- ятся прямоугольники, основаниями которых служат отрезки оси абсцисс, длины которых равны длинам интервалов, а высотами

— отрезки, длины которых равны частотам или относительным частотам соответствующих интервалов. На рис. 358 представлена гистограмма, построенная по данным таблицы 54.

Гистограммы удобно строить с помощью компьютерной про-

граммы Microsoft Excel (рис. 359).

Для графического изображения кумулятивного вари-

ационного ряда служитькумулята. Для ее построе-

ния на оси абсцисс откладываются варианты, а на оси

ординат — накопленные частоты или накопленные

относительные частоты. Масштаб на каждой оси выбирается произ-

вольно. Далее строятся точки, абсциссами которых служат вариан-

ты (в случае дискретных рядов) или верхние границы интервалов

(в случае интервальных рядов), а ординатами — соответствующие

накопленные­

частоты

(на-

копленные

относительные

частоты). Полученные точки

соединяются отрезками. По-

лученная ломаная и есть ку-

мулята.Нарис.360представ-

лена кумулята, построенная

по данным таблицы 55.

 

Выборочный метод в статистике

447

99 Контрольные вопросы

1°. Как по гистограмме построить полигон частот?

2°. Как изменится полигон частот, если вместо частот вариант использовать относительные частоты, не изменяя масштаба?

3. О чем свидетельствует гистограмма, являющаяся прямо­ угольником­ ?

4. Если кумулята строится по накопленным относительным ча- стотам, то чему равна ордината крайней правой точки?

5. Есть ли на кумуляте точки, для которых большей абсциссе со- ответствует меньшая ордината, если статистические данные упорядочены по возрастанию?

3. Статистические характеристики

В результате исследований, связанных с массовы-

ми явлениями, получают много числовых данных. Перед исследователем возникает проблема — най-

ти такие характеристики, которые бы достаточно полно характе-

ризовали соответствующий числовой материал. Характеристики,

которые базируются на данных массового наблюдения, называ-

ются обобщающими показателями. Эти характеристики вы-

числяют при помощи вариант и соответствующих частот (относи-

тельных частот). Важнейшие среди них — средние величины, то

есть такие значения, вокруг которых группируются наблюдаемые

варианты. Их называют мерами центральной тенденции. К

ним принадлежат среднее арифметическое, мода, медиана.

Пусть имеем п объектов, у которых измеряем некоторый при- знак, и получаем значения х1, х2, ..., хп. Среднее арифметиче- ское этих п значений обозначается через x и определяется так:

x = x1 + x2 + ... + xn .

n

Если значения повторяются несколько раз, то среднее арифме- тическое вычисляется с учетом частот:

x = x1n1 + x2n2 + ... + xknk . n1 + n2 + ... + nk

Здесь k — количество вариант, пі частота варианты хі, і = 1, 2, ..., k, n1 + n2 + ... + nk = n. Такую форму среднего арифметическо-

го иногда называют средним взвешенным.

448 Раздел7.Элементытеориивероятностей иматематическойстатистики

Пример 2. Для проверки семян на всхожесть посеяли 4 сотни семян, отдельно друг от друга. Из первой сотни взошли 92 семени, из второй — 90, из третьей — 93, из четвертой — 89. Найти сред- нюю всхожесть семян.

Общее количество взошедших семян равно 92 + 90 + 93 + 89=

=364. Разделив это число на количество посеянных семян (400), получим: x = 0,91 , то есть в среднем взошли 91 % семян. g

Ответ. 0,91.

Пример 3. В таблице 57 приведены данные о количестве бал- лов, набранных учениками на районной математической олим- пиаде. Вычислить по этим данным средний балл.

 

 

 

 

 

 

 

 

Таблица 57

Варианта, х

2

3

5

6

8

9

10

11

15

18

Частота, п

1

2

4

3

2

2

2

3

1

1

Вычисления проведем по схеме, представленной в табли- це 58.

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 58

1

 

2

3

4

5

6

7

 

8

 

9

10

Сумма

хі

2

 

3

5

6

8

9

10

 

11

 

15

18

 

пі

1

 

2

4

3

2

2

2

 

3

 

1

1

21

хіпі

2

 

6

20

18

16

18

20

 

33

 

15

18

166

Таким образом, средний балл

x =

166

≈ 8 .

 

 

 

Ответ. ≈ 8.

 

 

 

 

 

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так же вычисляется среднее арифметическое по данным ин- тервального вариационного ряда. В качестве значения признака для всех элементов в данном интервале берут середину интерва- ла. При этом допускается определенная неточность, но обычно в различных интервалах погрешности будут разных знаков, а по-

этому при большом количестве наблюдений они в значительной мере «гасят» друг друга.

Пример 4. По данным таблицы 54 из предыдущего пункта вычислить средний балл, набранный выпускниками на ВНО.

Вычисления представлены в таблице 59.

Выборочный метод в статистике

 

449

 

 

 

 

 

Таблица 59

 

Количество

Количество

хі

 

хіпі

 

 

 

балов

учеников, пі

 

 

 

 

 

 

 

 

 

100–125

5

112,5

 

562,5

 

 

 

126–150

13

138

 

1794

 

 

 

151–175

9

163

 

1467

 

 

 

176–200

3

188

 

564

 

 

 

Сумма

30

 

 

4387,5

 

 

x = 4387,5 ≈ 146,3 . Если бы мы вычислили этот средний балл

30

по данным таблицы 53, мы бы получили x = 437430 ≈ 146 . Резуль-

таты отличаются незначительно. g

Ответ. ≈ 146,3.

Среднее арифметическое значений некоторой совокупности является важной ее обобщенной характеристикой, но не единст- венной. Для характеристики вариационных рядов применяется такая характеристика, как мода.

Мода — это варианта, которая чаще всего встреча- ется в совокупности.

Вслучае дискретных рядов указать моду нетрудно. Достаточно найти варианту, имеющую наибольшую частоту или относитель- ную частоту, это и будет мода. Будем обозначать ее символом Мо. По данным таблицы 53, Мо = 130. Этот результат имеет вполне определенный смысл — больше всего выпускников получили на ВНО 130 баллов. Как видим, в данной ситуации мода существен- но отличается от среднего арифметического.

Вкачестве характеристики вариационного ряда применяют также медиану.

Медиана — это значение признака, делящее всю сово- купность пополам.

Итак, число значений, меньших медианы, равно числу значе- ний, больших медианы. Будем обозначать медиану символом Ме.

Если объем совокупности нечетный и равен 2m + 1, значения хі не убывают:

x1 ,x2 ,...,xm ,xm+1 ,xm+2 ,...,x2m+1 ,

 

 

 

m а

m а

450 Раздел7.Элементытеориивероятностей иматематическойстатистики

то Ме= хm + 1. Если же количество элементов четно и равно 2m, то нет значения, делящего совокупность на две равные по объему части:

x1 ,x2 ,...,xm ,xm+1 ,...,x2m .

 

 

 

 

 

m а

m а

Поэтому за медиану условно берется полусумма значений, на-

ходящихся в середине совокупности данных:

Me =

xm + xm+1

.

 

 

2

 

 

 

Пример 5. Вычислить медиану: 1) по следующим данным: 1, 3, 3, 4, 4, 4, 5, 5, 7; 2) по данным таблицы 53.

1) В совокупности нечетное число данных — девять. Они расположены в неубывающем порядке. На среднем, пятом, месте стоит 4. Следовательно, Ме = 4.

2) Так как в рассматриваемой совокупности 30 элементов (вы- пускников), упорядоченных по значению признака, и число эле- ментов четное, нужно найти полусумму числовых значений 15-го и 16-го элементов. Складывая последовательно частоты, находим первое число, равное половине общего числа элементов или пре- вышающее его, то есть число, не меньшее 15. В данном примере последовательно будем иметь: 1, 3, 5, 8, 12, 15. 15-му элементу совокупности соответствует варианта 135, а 16-му — 140, Следо-

вательно, Ме = 135 +140 = 137,5 .

2

Полученное значение медианы означает, что примерно поло- вина выпускников получила 137,5 и меньше баллов, и примерно половина — 137,5 и больше баллов. g

Ответ. 1) 4; 137,5.

!Обращаем внимание на ошибку, которая часто встреча- ется при вычислении медианы. Иногда не учитывают ча- стоты вариант и общее количество элементов и за медиа- ну берут полусумму средних вариант.

Впримере 5, 2) количество вариант равно 16, средние 8-я и 9-я,

их полусумма равна 146 +149 = 147,5 , что неверно.

2

Средние величины являются важными характеристиками статистической совокупности. Они говорят нам о концентрации совокупности значений на числовой шкале. Каждая мера дает такое значение, которое «представляет» в определенном смы-