
- •Математическая статистика в примерах и задачах
- •Рецензент
- •Оглавление
- •Предисловие
- •Модуль 1. Анализ вариационных рядов
- •1.1. Генеральная совокупность. Выборочный метод. Графическое и табличное представление данных Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.2. Выборочные числовые характеристики Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.3. Точечные оценки. Методы нахождения точечных оценок Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.4. Доверительные интервалы Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •1.5 Проверка статистических гипотез Опорный конспект
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •Модуль 2. Линейная регрессия. Элементы корреляционного анализа
- •Вопросы для самоконтроля
- •Образцы решения типовых задач
- •Задачи для самостоятельного решения
- •Индивидуальные домашние задания.
- •Приложение
- •Литература
Вопросы для самоконтроля
1.Что характеризует точность оценки параметра?
2. Что называется надежностью (доверительной вероят-ностью) оценки? Как она обозначается?
3. Что называется доверительным интервалом для оцениваемого параметра с заданной надежностью?
4. Какой вид имеют доверительные границы довери-тельного интервала?
5. Что называется предельной погрешностью точечной оценки параметра?
6. Что происходит с длиной доверительного интервала при увеличении объема выборки? увеличении доверительной вероятности?
7. Являются ли концы интервалов постоянными величи-нами? Случайными величинами?
8. Опишите общую схему построения доверительного интервала.
9. Укажите формулу для доверительного интервала а параметра нормального распределения.
10. Укажите
формулу для
доверительного
интервала параметра нормального
распределения.
11. Как строится доверительный интервал для неизвестной вероятности события?
12. Чем отличается вероятностный подход к определению точности оценки от принятого в математическом анализе?
13. Объясните, почему доверительный интервал для мате-матического ожидания при известной дисперсии находится точно, если наблюдаемая случайная величина распределена нормально, а в произвольном случае – приблизительно и лишь при больших выборках.
Образцы решения типовых задач
Пример 1.
Найти
минимальный объем выборки, при котором
с надежностью
0,925 точность оценки математического
ожидания нормально
распределенной генеральной совокупности
(по выборочному среднему )
равна
,
если известно среднее квадратическое
отклонение генеральной совокупности
.
Решение.
Формула,
определяющая точность оценки
математического
ожидания генеральной совокупности
по выборочной средней,
имеет вид
Отсюда
следует, что
(при
этом п
обычно
округляется в большую сторону для
надежности). По
таблице функции Лапласа находим
для
данного примера, учитывая,
что функция принимает значение
=
0,925/2 = 0,4625. Таким
образом,
.
Подставляя данные этой задачи, получаем
искомый объем выборки п:
Берем округленно п = 179.
Пример 2.
Произведено
5 независимых наблюдений над с.в.
~
Результаты наблюдений таковы:
,
,
,
.
Найти оценку для
,
а также построить для
него 95%-й доверительный интервал.
Решение.
Находим
сначала
(–25
+ 34 – 20 + 10 + + 21)/5 = 4. Учитывая,
что
и
,
получаем
.
По
таблице (функции
Лапласа)
выясняем, что
Тогда
Доверительный интервал для a
= M(X)
таков: (4
– 17,5; 4 + 17,5), т.е. (–13,5; 21.5).
Пример 3.
По
условию примера 2, считая, что с.в.
~
,
построить
для неизвестного M(X) = а
доверительный
интервал. Считать
= 0,95.
Решение.
Оценку
для
M(X)
уже
знаем:
.
Находим значение s:
((–25
– 4)2
+ (34 – 4)2
+ (–20 – 4)2
+ + (10 – 4)2
+ (21 – 4)2)/4
=
660,5; s
25,7.
По
таблице 3 для
= 0,95 и
находим
.
Следовательно,
Доверительный
интервал таков: (–27,9;
35,9).
Пример 4.
Произведено 20 опытов над случайной
величиной X,
распределенной
по нормальному закону. Требуется
построить доверительные интервалы для
математического ожидания и
дисперсии,
соответствующие доверительной вероятности
если
получены оценки математического ожидания
и дисперсии:
Решение.
По
таблице 3 для числа степеней свободы
и
доверительной вероятности
находим
значение
Тогда
Доверительный интервал для математического ожидания принимает вид
Если
доверительная вероятность то
уровень значимости
По
таблице 2 приложения найдем значения
критических точек распределения
Доверительный интервал для дисперсии:
.
.
Пример 5. В таблице приведены сгруппированные данные измерений роста у 50 случайно отобранных студентов.
Рост студентов, см |
162–166 |
166–170 |
170–174 |
174–178 |
178–182 |
182–186 |
Число студентов |
3 |
7 |
15 |
13 |
11 |
1 |
Построить доверительный интервал для среднего роста студентов с надёжностью 0,9.
Решение. Так как данные сгруппированы, то в качестве представителя каждой группы можно взять середину интервала. Тогда
s = 4,87.
По
таблице функции
находим значение
для которого
Тогда по формуле
находим
или
Пример
6. Измерения
сопротивления резистора дали следующие
результаты (в омах):
Известно, что ошибки измерения имеют нормальный закон распределения. Систематическая ошибка отсутствует. Построить доверительный интервал для истинного сопротивления резистора с надёжностью 0,99 в предположении:
а) дисперсия ошибки измерения известна и равна 4;
б) в предположении неизвестной ошибки измерения.
Решение.
Результаты
измерения
можно представить в видеX
= a
+ Y,
где a
– истинное значение измеряемой величины,
а Y
– ошибка измерения. Систематическая
ошибка отсутствует (
),
поэтому
и
,т.е. доверительный
интервал для M(X)
будет доверительным интервалом для
истинного значения сопротивления
резистора. В данной серии наблюдений
Если
дисперсия известна, то доверительный
интервал можно построить, используя
устойчивость нормального закона
распределения. Так как
и
,
то
,
откуда
Из
таблицы функции Лапласа находим, что
Тогда
или
В результате
или
.
В случае неизвестной дисперсии, её оценку можно получить на основе тех же опытных данных
.
По
таблице 3 критических точек распределения
Стьюдента для
степеней свободы и заданной вероятности
находим такое
,
что
,
.
Пример 7. С целью определения средней суммы вкладов в сберегательной кассе, имеющей 7200 вкладчиков, произведено выборочное обследование (бесповторный отбор) 111 вкладчиков, которое дало следующие результаты:
Сумма вклада, тыс. руб. |
10 – 30 |
30 – 50 |
50 – 70 |
70 – 90 |
90 –110 |
110 –130 |
Число вкладов |
1 |
3 |
10 |
30 |
60 |
7 |
Пользуясь этими данными, найдите доверительные границы для генерального среднего, которые можно было бы гарантировать с вероятностью 0,95.
Решение.
– неизвестно,
но при больших n
.
Сначала
найдем
выборочную среднюю
и выборочную
дисперсию
при помощи расчетной таблицы:
Интервалы |
|
|
|
|
10 – 30 |
20 |
1 |
20 |
400 |
30 – 50 |
40 |
3 |
120 |
4800 |
50 – 70 |
60 |
10 |
600 |
36 000 |
70 – 90 |
80 |
30 |
2400 |
192 000 |
90 – 110 |
100 |
60 |
6 000 |
600 000 |
110 – 130 |
120 |
7 |
840 |
100 800 |
– |
– |
111 |
9980 |
934 000 |
Так
как
и
(cм.
таблицу 1 приложения),
то предельная погрешность
= 1,96
1,68
= 3,3826 и доверительными
границами для генерального среднего
будут
и
Пример
8.
Аналитик
фондового рынка оценивает среднюю
доходность
определенных акций. Случайная выборка
15 дней показала, что
средняя (годовая) доходность
с исправленным средним
квадратическим отклонением s
= 3,5%. Предполагая, что доходность
акций подчиняется нормальному закону
распределения, постройте
95%-ный доверительный интервал для средней
доходности интересующего
аналитика вида акций.
Решение.
–
неизвестно,
и поскольку объем выборки
п
= 15,
то необходимо
применить распределение Стьюдента с
степенями
свободы.
В таблице 3 приложения на пересечении
строки, соответствующей 14 степеням
свободы, и колонки, соответствующей
уровню значимости
а
=
0,05 для двусторонней критической
области, находим
.
Используя это значение, построим 95%-ный
доверительный
интервал:
(8,44;
12,3).
Следовательно, аналитик может быть на 95% уверен, что средняя годовая доходность по акциям находится между 8,44% и 12,3%.
Пример 9. Определите численность выборки при обследовании остатков на расчетных счетах у клиентов коммерческого банка, чтобы с вероятностью 0,683 ошибка репрезентативности не превышала 5 тыс. руб., если σген = 120 тыс. руб.
Решение.
–
известно.
Предполагается, что выборка – повторная.
По
таблице 1 приложения по заданной
доверительной вероятности
находим аргумент
функции Лапласа
Следовательно, объем выборки, при котором с вероятностью 0,683 можно утверждать, что средняя выборочная отличается от генеральной по абсолютной величине меньше чем на 5 тыс. руб., определяется по формуле
Пример 10.
По
случайной выборке измерений роста 20
студентов
первого курса Смоленского университета
вычислена несмещенная оценка
генеральной дисперсии
Найдите 95%-ный доверительный
интервал для среднего квадратического
отклонения роста всех студентов
первого курса Смоленского университета,
если распределение
роста нормально.
Решение.
= 0,95, 1–α = 0,95, α = 0,05. Для
нахождения искомого доверительного
интервала по таблице 2 приложения
найдем
и
Искомый доверительный интервал имеет вид:
Пример 11. Для отрасли, включающей 1200 фирм, составлена случайная выборка из 19 фирм. По выборке оказалось, что исправленное среднее квадратическое отклонение для числа работающих на фирме составляет s = 25 (человек). Пользуясь 90%-ным доверительным интервалом, оценить среднее квадратическое отклонение для числа работающих на фирме по всей отрасли, построив доверительный интервал.
Решение.
Доверительный
интервал для параметра
имеетвид
где
и
находят
по таблице критических точек распределения
хи-квадрат. По таблице 2 приложения
определяем для данного примера
Подставляя в формулу необходимые величины, получаем искомый доверительный интервал:
19,74
<
< 34,61 (человек).
Пример 12. На основании выборочных наблюдений производительности труда 20 работниц было установлено, что среднее квадратическое отклонение суточной выработки составляет 15 м ткани в час. Предполагая, что произво-дительность труда работницы имеет нормальное распределение, найти границы, в которых с надёжностью 0,9 заключены генеральные дисперсия и среднее квадратическое отклонение суточной выработки работниц.
Решение.
Имеем
При
числе степени свободы по таблице 2
приложения определим
=
30,1 и
= 10,1. Тогда
доверительный интервал для
можно записать в виде:
или
и
для :
или
(м/ч).
Итак, с надёжностью 0,9 дисперсия суточной выработки работниц заключена в границах от 142 до 423,3, а её среднее квадратическое отклонение – от 12 до 20,7 метров ткани в час.
Пример 13. Для определения процента вкладов, не превышающих 100000 руб., произведена повторная выборка 900 лицевых счетов. Среди них оказалось 30% вкладов не более 100000 каждый. С какой доверительней вероятностью можно утверждать, что процент таких вкладов в данной кассе будет отличаться от найденного не более чем на 2%?
Решение.
n
= 900;
;
.
Так как
,
то
.
Искомая
вероятность Р
=
=
2
= 2
0,4049 = 0,8098.
Пример 14. Для обследования крупной парии изделий отобрано наугад 900 штук. Проверка показала, что среди них 810 стандартны. Построить доверительный интервал для доли стандартных изделий в партии. Уровень надёжности выбрать равным 0,95.
Решение.
Пусть доля стандартных изделий в партии
равна p.
Оценкой её
может служить величина
По таблице функции Лапласа
находим такое
чтобы
Тогда по формуле
.
Пример 15. Из партии, содержащей 10000 музыкальных центров «Samsong», отобрано 3000 штук. В выборке оказалось 4% музыкальных центров с бракованными компакт-дисками. Определите границы, в которых заключена доля стандартных музыкальных центров в генеральной совокупности, если результат необходимо гарантировать с вероятностью, равной 0,9976.
Решение.
Имеем N
= 10000; n
= 3000;
По заданной вероятности 0,9976 найдем
= 0,4938
и по таблице
1 приложения определим
=
(0,4938)
= 2,5. Получим
предельную ошибку выборки:
=
2,5·0,0036 = 0,009
(≈ 0,9%).
Тогда доверительными границами для генеральной доли будут
=
0,04 – 0,009 = 0,031 (≈
3,1%)
и
=
0,04 + 0,009 = 0,049 (≈
4,9%).
Пример 16. Сколько лиц в возрасте от 20 до 30 лет надо опросить выборочно, чтобы установить среди них процент студентов с точностью до 0,5%, гарантируемой с вероятностью 0,9999?
Решение.
;
= 0,9999; п
= ?
По
заданной доверительной вероятности
находим
.
Следовательно, объем выборки, при котором с вероятностью 0,9999 можно утверждать, что выборочная доля отличается от генеральной доли по абсолютной величине меньше чем на 0,5%, определяется по формуле
.
При
определении средней квадратической
ошибки выборки для доли,
если даже выборочная доля
неизвестна, в качестве
можно
взять его
максимально возможное значение
()max
= [p*(1–p)*]max
= 0,5·0,5 = 0,25
.
Тогда
nmax
=
= 160000.
Пример 17. За последние 5 лет годовой рост цены актива А составлял в среднем 20% со средним квадратическим отклонением (исправленным) 5%. Построить доверительный интервал с вероятностью 95% для цены актива в конце следующего года, если и начале года она равна 100 ден. ед.
Решение. Рассмотрим величины относительного прироста пены актива за год. Будем пользоваться нормальным приближением. Применяем формулу
где
находим
из таблицы 3 критических точек распределения
Стьюдента:
Получаем,
0,2
– 0,05∙2,78
< x6
<
0,2 + 0,05∙2,78
,
откуда
0,05
<
<
0,35.
Таким образом, цена актива в следующем году составит от 105 до 135 ден. ед.
Пример
18. Случайная
величина Х
имеет нормальное распре-деление
с известным средним квадратическим
отклонением
Найти доверительный интервал для
неизвестного математического
ожидания а
по
выборочному среднему
,
если объем выборкип
= 36
и задана надежность оценки
= 0,95.
Решение. Для решения этой задачи воспользуемся статистической функцией в MS Excel ДОВЕРИТ.НОРМ, для этого:
На листе MS Excel выбрать ячейку, в которую будет помещен результат вычисления значения доверительного интервала.
Перейти на вкладку Формулы-Другие функции-Статистические и в раскрывающемся списке выбрать ДОВЕРИТ.НОРМ
Ввести исходные данные в поля:
где Альфа=1-β
Доверительный интервал для математического ожидания a по выборочному среднему 5 (
): (4,02; 5,98).