
- •Лекция1. Основные понятия математической статистики
- •1.1. Основные понятия выборочного метода
- •1.2. Выборочное распределение
- •1.3. Эмпирическая функция распределения, гистограмма
- •1.4. Выборочные моменты
- •1.5. Сходимость эмпирических характеристик к теоретическим
- •1.5.1. Свойства эмпирической функции распределения
- •1.5.2. Свойства гистограммы
- •1.5.3. Свойства выборочных моментов
- •1. Свойства выборочного среднего.
- •2.Свойства выборочной дисперсии.
Лекция1. Основные понятия математической статистики
Математическая статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи.
В теории вероятностей рассматриваются случайные величины с заданным законом распределения. Предмет теории вероятностей — свойства и взаимосвязи этих величин (распределений).
Но часто наблюдатель имеет набор числовых (или их можно сделать числовыми) результатов, полученных повторением одного и того же случайного эксперимента в одинаковых условиях.
При этом возникают, например, следующие вопросы:
- если мы наблюдаем одну случайную величину — как по набору ее значений в нескольких опытах сделать как можно более точный вывод о ее распределении?
-если мы наблюдаем одновременно проявление двух (или более) признаков, т.е. имеем набор значений нескольких случайных величин — что можно сказать об их зависимости? Есть она или нет? А если есть, то какова эта зависимость?
Часто возникает возможность высказать некие предположения о распределении или о его свойствах. В этом случае по опытным данным требуется подтвердить или опровергнуть эти предположения («гипотезы»). При этом надо помнить, что ответ «да» или «нет» может быть дан лишь с определенной степенью достоверности, и чем дольше мы можем продолжать эксперимент, тем точнее могут быть выводы.
Примером таких опытных данных может служить набор данных в научном эксперименте, социологический опрос или последовательность гербов и решек при многократном подбрасывании монеты.
1.1. Основные понятия выборочного метода
Пусть Х – случайная величина, наблюдаемая в случайном эксперименте.
Будем
считать, что проведя n
раз этот эксперимент в одинаковых
условиях, мы получили числа
—
значения этой случайной величины в
первом, втором, и т.д. опытах. Случайная
величина Х
имеет некоторое распределение
,
которое нам частично
или полностью неизвестно.
Рассмотрим подробнее набор (Х1,Х2,….,Хn), называемый выборкой.
В серии уже произведенных экспериментов выборка — это набор чисел. Но если эту серию экспериментов повторить еще раз, то вместо этого набора мы получим новый набор чисел. Вместо числа Х1 появится другое число — одно из значений случайной величины Х. То есть Х1(иХ2, иХ3, и т.д.) — переменная величина, которая может принимать те же значения, что и случайная величина Х, и также часто ( с теми же вероятностями). Поэтому до опытаХ1— случайная величина, одинаково распределенная с Х, а после опыта — число, которое мы наблюдаем в первом эксперименте, т.е. одно из возможных значений случайной величины Х1.
Выборка
(Х1,,Х2,...,,Хn)
объема n—
это набор из
независимых
и одинаково распределенных
случайных величин(<<копий х>>),
имеющих, как и Х, распределение F(x).
1.2. Выборочное распределение
Рассмотрим
какую-нибудь реализацию
выборки Х1,….,Хn.
Введем случайную величину Х*, принимающую
значенияХ1,...
,
Хn
с вероятностями по
(если
какие-то из значений совпали, сложим
вероятности соответствующее число
раз). Таблица распределения вероятностей
и функция распределения случайной
величины Х* выглядят так:
|
|
Распределение величины Х* называют эмпирическим или выборочным распределением. Вычислим математическое ожидание и дисперсию величины Х* и введем обозначения для этих величин:
Точно
так же вычислим и момент порядка
Если при построении всех введенных нами характеристик считать выборкуX1, , Xn, набором случайных величин, то и сами эти характеристики и Fn*(y) — станут случайными величинами. Эти характеристики выборочного распределения используют для оценки (приближения) соответствующих неизвестных характеристик истинного распределения.
Причина использования характеристик распределения Х* для оценки характеристик истинного распределения Х— в близости этих распределений при больших n.