
- •I. Элементы теории вероятности
- •1. Вероятность по лапласу (Классическая вероятность)
- •2. Элементы комбинаторики
- •2. Основные теоремы комбинаторики.
- •2.2.Перестановки с повторениями.
- •2.3. Упорядоченные множества. Размещения без повторений.
- •2.4. Размещения с повторениями.
- •2.5. Сочетания.
- •2.6. Свойства сочетаний. Формула бинома Ньютона.
- •3. Методы решения комбинаторных задач.
- •1.2 Действия над событиями
- •1.3 Свойства операций над событиями
- •1.4. Геометрическая вероятность
- •2. Вероятность по мизесу (Статистическая вероятность)
- •3. Вероятность по колмогорову (Аксиоматическая вероятность)
- •2. Принципы теории вероятностей.
- •2.1. Принцип сложения.
- •2.2. Принцип умножения.
- •2.3. Полная вероятность и формула Байеса
- •3. Схемы испытаний
- •Случайные величины
- •Повторные испытания.
- •Распределения, связанные с повторными испытаниями.
- •Двумерные случайные величины
- •Свойства функции распределения.
- •Элементы математической статистики
- •1. Что такое математическая статистика?
- •2. Понятие выборки.
- •3. Построение вариационных рядов
- •Точечные оценки параметров генеральной совокупности по выборочным совокупностям, их свойства. Точечные оценки для математического ожидания и дисперсии случайной величины
- •Оценка для математического ожидания случайной величины
- •Оценка для дисперсии случайной величины
- •Интервальные оценки. Доверительный интервал. Нахождение доверительных интервалов для математического ожидания и дисперсии нормального распределения случайной величины
- •1. Доверительный интервал для оценки математического ожидания нормального распределения случайной величины с известным
- •2. Доверительный интервал для оценки математического ожидания нормального распределения с неизвестным
- •3. Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения
- •Статистическая проверка гипотез. Статистическая гипотеза. Нулевая и конкурирующая гипотеза. Статистический критерий. Критическая область
Элементы математической статистики
1. Что такое математическая статистика?
Первоначально слово статистика означало просто государственный подсчёт. (Слово «статистика» происходит от латинского слова status - государство.) С древнейших времен статистику использовали для того, чтобы информировать правителей стран о величине налога, который можно собрать с их подданных, или о числе солдат, на которое можно рассчитывать в военное время. В Китае учет населения проводился более четырех тысяч лет назад. Согласно Библии, Моисей также подсчитывал всех мужчин своего народа старше 20 лет.
Сейчас статистика – это математическая дисциплина, изучающая методы сбора и анализа данных, относящихся к наблюдениям над случайными массовыми явлениями. Главная цель статистики - получение осмысленных заключений из несогласованных (подверженных разбросу) данных. Реальные данные, исключая тривиальные ситуации, всегда являются несогласованными. Разброс между наблюдениями обусловлен самыми разными причинами. Это может быть ошибка при считывании показаний прибора, если указатель расположен между двумя делениями шкалы. Это могут быть флуктуации в атмосфере случае мерцания звезд, или шум при работе электронного оборудования. Можно еще привести пример объектов, которым присуща врожденная изменчивость измеряемой характеристики (например, рост десятилетних мальчиков).
Чаще всего ситуация слишком сложна, чтобы ее можно было изучить на основе полного описания, отражающего все детали. Поэтому обычно применяется некоторая математическая модель явления. Она должна воспроизводить существенные черты явления и исключать те, которые предполагаются несущественными.
Пусть, например, проводится эксперимент по определению смертельной дозы инсектицида. Действие различных доз инсектицида измеряется числом насекомых, погибших после применения соответствующей дозы. При очень низкой дозировке насекомые не погибают, при очень высокой погибают все. В то же время при промежуточных дозах процент погибших насекомых подвержен экспериментальному разбросу и зависит от многих факторов, в среднем возрастает с увеличением дозы. Необходимо:
а) подобрать правдоподобную параметрическую модель для описания кривой роста доли погибших насекомых в зависимости от дозировки;
6) оценить параметры этой кривой и проверить, что результирующая кривая действительно является приемлемой моделью;
в) получить значение дозировки, при которой погибает 50% насекомых (эта величина будет служить принятой мерой токсичности), вместе с оценкой ее надежности.
Оценка точности должна показать, являются ли различия в оценках параметров настолько значимыми, чтобы можно было говорить о различиях между действительными (неизвестными) их значениями.
Она необходима также для того, чтобы проверить, дает ли избранное семейство распределений приемлемую модель для наблюдаемых данных.
Таковы наиболее важные черты статистического вывода.
2. Понятие выборки.
Понятие выборки и способов её получения есть одно из центральных понятий математической статистики. Говорят, что каждая третья студентка Гарвардского университета выходит замуж за одного из своих преподавателей. На самом же деле в 1901 году в университете обучались только З девушки, одна из которых вышла замуж за своего профессора. Ясно, что в данном случае недостаточен объём выборки. Но не так просто сказать, какой объём выборки достаточен.
Рассмотрим ещё пример. Пусть имеется партия из 10000 номинально идентичных изделий. Известно, что некоторые из этих изделий дефектны: их критические размеры лежат вне допустимых границ. Требуется оценить долю (скажем, В) дефектных изделий в партии на основе результатов точного измерения размеров, проведенного на выборке из 20 изделий, взятых из партии. Рассмотрим процедуру формирования выборки. Предположим, что она организована следующим образом: 20 изделий должны быть выбраны «случайно», т. е. таким образом, чтобы при каждом акте выбора все изделия в партии имели бы одинаковый шанс быть отобранными. Так как в нашем случае партия очень велика по сравнению с объемом выборки, доля дефектных изделий в ней после извлечения выборки не будет существенно отличаться от исходной, доли В.Такой выбор называется репрезентативным.
Однако, конкретизация представления о том, что такое случайный выбор, даже в теории вероятностей очень не просто, что можно проиллюстрировать известным парадоксом Бертрана.
Получение разных результатов кажется парадоксальным, так как было убеждение, что слова «случайный выбор» однозначно определяют искомую вероятность. Парадокс показывает, что возможны различные способы выбора случайным образом, причем каждый способ выглядит по-своему «естественным». Фактически это означает, что в зависимости от того, что именно мы понимаем под словами «Случайным образом (равномерно)», вероятности могут быть выбраны многими различными способами.
Наконец,
выборка должна быть статистически
устойчива.
Пусть в серии
из
опытов случайное событие А осуществлялось
раз. Тогда отношение
называют
относительной
частотой события А
в этой серии испытаний. Если при условии
независимости исходов отдельных опытов
различные серии испытаний (по n
испытаний каждая) дают весьма близкие
значения относительной частоты, то
говорят, что относительная частота
события обнаруживает при больших n
свойство стабильности
или статистической устойчивости.
Статистической
вероятностью
события А в данном испытании называется
число Р(А), около которого группируются
значения относительной частоты при
больших n.
.
Кроме того, в статистике в статистическую
устойчивость включается ещё и требование
отсутствия
статистических взаимосвязей
между явлениями. Что это такое показывает
знаменитый парадокс
Джиффена. В
конце XIX
века английский статистик Джиффен
установил, что при повышении цены на
дешевый, но необходимый товар (например,
хлеб) спрос на него увеличивается, а не
уменьшается, хотя как будто бы является
очевидным, что с повышением цены на
товар спрос на него должен падать.
Только в 1915 г. Е. Е. Слуцкий дал объяснение этого парадокса. Повышение цены на товар должно повлечь за собой понижение покупательной способности, однако если товар насущно необходим (каковым и является хлеб), то спрос на него не может сократиться, как бы ни менялась цена в пределах бюджета покупателя. Поэтому спрос на хлеб не уменьшился, а уменьшились возможности покупки других более дорогостоящих продуктов (мясо, масло и т. д.). Значит, вместо этих продуктов приходится покупать более дешевый продукт, т. е. хлеб.
Таким образом, в основе математической статистики лежит сложное и противоречивое понятие выборки.