
- •Содержание
- •Тема 2. Классические теоремы теории вероятностей
- •Если события а, в, с совместны, то
- •Формула полной вероятности имеет вид
- •Тема 3. Повторные независимые испытания
- •Тема 4. Случайные величины и законы их распределения
- •Тема 5. Числовые характеристики случайных величин
- •Пусть с – постоянная величина. Тогда
- •Для вычисления дисперсии используется формула
- •Дисперсия обладает свойствами
- •Тема 6. Основные дискретные случайные величины и их числовые характеристики
- •Если случайная величина распределена по закону Пуассона, то
- •Тема 7. Основные непрерывные случайные величины и их числовые характеристики
- •Плотность нормального распределения имеет вид
- •Дисперсия нормального распределения
- •Правило трех сигм записывается в виде равенства
- •2. Для нахождения математического ожидания и дисперсии применим формулы (7.3). Получим следующие значения:
- •Ошибка указания времени часами со скачущей минутной стрелкой имеет равномерное распределение. Определить вероятность того, что при определении времени ошибка не будет превышать 20 секунд.
- •Тема 8. Закон больших чисел и центральная предельная теорема
- •В предельной форме утверждения теоремы Бернулли имеют вид
- •Тема 9. Основные понятия математической статистики. Числовые характеристики
- •На практике для вычисления дисперсии применяется формула
- •Легко установить, что
- •Вычислим размах товарооборота по формуле (9.14). Получим, что
- •Тема 10. Статистические оценки
- •Если дисперсия несмещенной оценки при n→стремится к нулю, то такая оценка будет и состоятельной. Это следует из неравенства Чебышева (см.(8.2))Рдля случайной величины*.
- •Тема 11. Корреляция и регрессия
- •Непосредственно из этого определения следует, что
- •Тема 12. Проверка статистических гипотез
На практике для вычисления дисперсии применяется формула
ДВ
=
,
(9.7)
где
(среднее квадратов значений признака),
а
(средняя выборочная).
При
вычислении
и ДВ
в случае интервальной выборки за хi
в формулах (9.3) - (9.7) принимают значения
хi
* - середины
интервалов.
Выборочным средним квадратическим отклонением (стандартом) В называется квадратный корень из выборочной дисперсии:
В
=
.
(9.8)
Начальный
эмпирический момент порядка k
определяется по формуле
.
(9.9)
Отсюда
мы видим, что начальный эмпирический
момент первого порядка (k=1)
равен выборочной средней
.
Центральный эмпирический момент mk порядка k определяется равенством
mk=
.
(9.10)
Отсюда видно, что m2=ДВ, т.е. центральный эмпирический момент второго порядка совпадает с выборочной дисперсией.
Равноотстоящими называют варианты, которые образуют арифметическую прогрессию с разностью h. Варианты Ui, определяемые равенством
Ui
=
,
называются условными. Здесь хi – первоначальные равноотстоящие варианты, h – разность прогрессии (шаг), С – ложный нуль (новое начало отсчета). В качестве ложного нуля можно принять любую варианту. Обычно в качестве ложного нуля выбирают варианту с наибольшей частотой или варианту, стоящую в середине вариационного ряда. Условные варианты являются целыми числами. При этом варианте, которая принята в качестве ложного нуля, соответствует условная варианта, равная нулю.
Условные
эмпирические моменты
порядка k
определяются по формуле
.
(9.11)
Легко установить, что
=
h
+ c,
(9.12)
ДВ
= []h2.
(9.13)
Метод произведений есть
некоторый удобный способ вычисления
условных моментов различных порядков
в случае равноотстоящих вариант. По
условным моментам можно найти начальные
и центральные эмпирические моменты.
Вычислять условные моменты
легко, так как условные вариантыUi
есть целые числа. В частности, по
формулам (9.12) и (9.13) можно вычислить
и ДВ. Максимальная простота
вычислений достигается, если в качестве
ложного нуля С выбрать варианту, которая
расположена примерно в середине
вариационного ряда.
Размахом варьирования Rназывают разность между наибольшей и наименьшей вариантами:
R=хmax – xmin. (9.14)
Размах есть самая простая характеристика рассеяния вариационного ряда. Еще одной характеристикой рассеяния служит среднее абсолютное отклонение , которое определяется равенством
=
.
(9.15)
Коэффициент вариации Vопределяется по формуле
V=.
(9.16)
Он служит для сравнения величин рассеяния двух вариационных рядов. Большее рассеяние имеет тот ряд, у которого коэффициент вариации больше.
Важными числовыми характеристиками являются мода и медиана.
Для дискретного статистического ряда мода есть значение признака, имеющего наибольшую частоту.
Определим теперь моду интервального ряда в случае постоянной длины hвсех интервалов. Пусть (хk,хk+1) – модальный интервал, т.е. интервал, которому соответствует наибольшая частотаnk. Пустьnk-1 – частота интервала, предшествующего модальному, аnk+1 – частота интервала, следующего за модальным. Тогда мода М0вычисляется по формуле
М0=хk+h. (9.17)
Медианой Меназывается такое значение признака, относительно которого статистический ряд делится на две части, причем в одной из них содержатся члены, у которых значения не больше Ме, а в другой – члены со значениями не меньше чем Ме.
Пусть выборка дискретна и значения признака различны. Если число вариант четное (n=2k), то
Ме=.
(9.18)
Если число вариант нечетное (n=2k+1), то
Ме=хk+1 . (9.19)
Пусть выборка дискретна и
значения признака повторяются. Если
объем статистической совокупности
является нечетным числом, то в качестве
медианы берут такое значение признака
Х, для которого
накопленная частота SH
(сумма частот вариант, не превосходящих
данного значения) равна SH
=
,
где квадратные скобки показывают, что
от числа
нужно взять только целую часть.
Если объем выборки является четным числом, то Меопределяется равенством
Ме=,
(9.20)
где
-
первое значение признака, для которого
накопленная частота
не
менее
и
-
первое значение признака, для которого
накопленная частота
не менее
.
Если статистический ряд
задан интервалами, то медиану находят
следующим образом. Выявляют первый
интервал, для которого накопленная
частота равна или больше половины объема
статистической совокупности
.
Этот интервал называется медианным.
Величину медианы определяют по формуле
Ме=,
(9.21)
где хk- левая граница медианного интервала;Sk-1 – накопленная частота интервала, предшествующего медианному;nk– частота медианного интервала.
Асимметрия и эксцессэмпирического распределения определяются равенствами:
,
(9.22)
,
(9.23)
где m3,m4 – центральные эмпирические моменты, соответственно, третьего и четвертого порядка. Эти характеристики используют для оценки отклонения эмпирического распределения от нормального.
Р е ш е н и е т и п о в ы х з а д а ч
Задача 1. Выборка шарикоподшипников, изготовленных станком-автоматом, дала после измерения на весах следующие результаты в граммах: 39, 41, 40, 40, 43, 41, 44, 42, 41, 41, 43, 42, 39, 40, 42, 43, 41, 42, 41, 39, 42, 42, 41, 42, 40, 41, 43, 41, 39, 40. Составить статистическое распределение выборки. Построить полигоны частот и относительных частот.
Решение. Значения хi вариант выборки (вес шарикоподшипников) расположим в порядке возрастания в первой строке таблицы, а во второй строке – количество шарикоподшипников этого веса (частоты):
хi |
39 |
40 |
41 |
42 |
43 |
44 |
ni |
4 |
5 |
9 |
7 |
4 |
1 |
Получили дискретное статистическое распределение выборки объема n=ni = 4+5+9+7+4+1=30. Мода М0=41.
Построим полигон частот. Для этого откладываем по оси Ох значения хi вариант выборки, а по оси ординат – частоты ni. Полученные точки соединяем отрезками прямых. Это и будет полигон частот (см.рис. ниже).
ni
9
7
5
4
1
0 39 40 41 42 43 44 х
Полигон относительных частот строится аналогично полигону частот. На оси ординат вместо частот ni откладываем относительные частоты Wi. Полигон относительных частот изображен ниже на рисунке.
Wi
0
х
Задача 2. Составить статистическое распределение выборки – рабочих по процентам выполнения норм выработки, если произведена случайная выборка объема 20 человек и получены такие данные относительно выполнения ими норм выработки в процентах: 127, 121, 112, 114, 131, 117, 109, 107, 155, 135, 103, 145, 99, 100, 97, 102, 122, 115, 132, 105. Построить гистограммы частот и относительных частот.
Решение. Находим наибольшее и наименьшее значения варианты Х: хнаиб=155, хнаим=95. Разобьем здесь объем выборки на 7 промежутков длиной h=10. Частичные промежутки расположим в первой строке таблицы, а во второй – количество рабочих, чья выработка заключена в данном частичном промежутке. Получим следующее интервальное распределение:
Процент нормы выработки рабочих |
90-100 |
100-110 |
110-120 |
120-130 |
130-140 |
140-150 |
150-160 |
Частоты (ni) |
2 |
6 |
4 |
3 |
3 |
1 |
1 |
Построим
гистограмму частот распределения. Для
этого по оси Oх
отложим промежутки распределения
выборки и на них как на основаниях строим
прямоугольники, высоты которых равны
соответственно
.
Гистограмма частот изображена на рисунке
ниже.
0
90
100
110
120
130
140
150
160
х
Нетрудно убедиться, что площадь построенных прямоугольников равна объему выборки:
Гистограмму
относительных частот строим аналогично
гистограмме частот. Только на оси ординат
вместо
откладываем значения
,
гдеWi
– относительные
частоты соответствующих частичных
промежутков. Изображение гистограммы
относительных частот см. на рисунке.
0
90 100 110 120
130 140 150 160 х
Сумма площадей построенных прямоугольников равна единице.
Задача 3. Данные о продаже женской обуви в магазине за день заданы таблицей
Размер обуви |
35 |
36 |
37 |
38 |
39 |
40 |
Количество проданных пар |
4 |
5 |
9 |
7 |
4 |
1 |
Найти эмпирическую функцию распределения выборки и построить ее график.
Решение.
Эмпирическую функцию распределения
выборки находим по формуле (9.1). Объем
выборки равен 4+5+9+7+4+1=30. Наименьшая
варианта равна 35. Значит, F*(х)=0
при х35.
Значения Х<36,
т.е. х1=35
наблюдались 4 раза. Следовательно,
F*(х)=при 35<
х
36. Значения Х<37
(х1=35,
х2=36)
наблюдались 4+5=9 раз. Следовательно,
F*(х)=
при 36<
х
37. Аналогично находим: F*(х)
=
при 37<
x
38; F*(х)
=
при 38<
х
39; F*(х)
=
при 39<
х
40. Так как х=40
– наибольшая варианта, то F*(х)=1
при х>40.
Запишем эмпирическую функцию:
F*(х)
=
График этой функции изображен на рисунке.
y
х
Задача 4. Распределение урожайности сои на площади в 1000 га дано в таблице
Урожай с га в центнерах |
9 |
9,6 |
10 |
10,5 |
11,4 |
12 |
Число га |
80 |
100 |
120 |
160 |
200 |
340 |
Определить выборочную среднюю, выборочную дисперсию и выборочное среднее квадратическое отклонение урожайности сои.
Решение. Выборочная средняя урожайности с га вычисляется по формуле (9.4):
=
(ц).
Для определения выборочной дисперсии воспользуемся формулой (9.6). Получим
ДВ
=
+
Выборочное
среднее квадратическое отклонение В
находим по формуле (9.8): В
=
1,02.
Задача 5. Вычислить выборочную среднюю, выборочную дисперсию, выборочное среднее квадратическое отклонение и коэффициент вариации для распределения заработной платы водителей автобазы (в руб. за месяц):
-
Зарплата (руб./месяц)
200-250
250-300
300-350
350-400
400-450
450-500
Количество водителей
10
30
20
20
10
10
Решение. Превратим данный интервальный ряд в дискретный, взяв в качестве вариант середины интервалов:
Зарплата (руб./месяц) |
225 |
275 |
325 |
375 |
425 |
475 |
Количество водителей |
10 |
30 |
20 |
20 |
10 |
10 |
По формуле (9.4) выборочной средней найдем, что
=
Вычислим выборочную дисперсию по формуле (9.7):
ДВ
=
Извлекая
корень квадратный из дисперсии, получим
выборочное среднее квадратическое
отклонение В
=
73,5.
Коэффициент вариации заработной платы водителей автобазы вычислим по формуле (9.16):
V
=
.
Задача 6. Дано следующее статистическое распределение выборки:
хi |
3 |
5 |
6 |
8 |
ni |
2 |
4 |
3 |
5 |
Вычислить начальные и центральные моменты первого, второго и третьего порядка, размах варьирования и среднее абсолютное отклонение.
Решение. Используя формулу (9.9), находим начальные моменты:
Центральные моменты вычисляем по формуле (9.10):
m1=0,
m2=ДВ=m3=
Используя формулы (9.14) и (9.15), получим
R=8-3=5,
=
Задача 7. Магазин в течение месяца реализовал 100 мужских костюмов. Распределение их по размерам дано таблицей
Размер костюма |
44 |
46 |
48 |
50 |
52 |
54 |
56 |
58 |
Количество костюмов |
3 |
9 |
16 |
24 |
29 |
15 |
3 |
1 |
Найти модальное значение размера проданного костюма.
Решение. Из таблицы видно, что частота 52-го размера проданного костюма равна 29 и она является наибольшей. Следовательно, мода М0=52.
Задача 8. Товарооборот магазина по месяцам составил (в тыс. руб.): 50; 53; 60; 52; 54; 48; 44,5; 62; 55; 53,5; 58, 64. Определить медиану и размах товарооборота.
Решение. Расположив месячные товарообороты в порядке их возрастания, получим ряд: 44,5; 48; 50; 52; 53; 53,5; 54; 55; 58; 60; 62; 64. В этом вариационном ряде четное число данных и значения признака различны, поэтому по формуле (9.18)
Ме
=