
- •1. Базовые понятия теории вероятностей
- •1.1. События. Вероятность. Случайная величина
- •1.2. Числовые характеристики случайных величин
- •1.3. Законы распределений случайных величин
- •1.4. Предельные теоремы теории вероятностей
- •2. Базовые понятия математической статистики
- •2.1. Генеральная совокупность и выборка
- •2.2.Статистическое распределение выборки
- •2.3. Статистическое оценивание
- •2.4. Точечные и интервальные статистические оценки
- •2.5. Вычисление выборочных характеристик
- •2.6. Основные законы распределения статистических оценок
- •3. Проверка статистических гипотез
- •3.1. Статистическая гипотеза. Ошибки 1 и 2 рода.
- •3.2. Статистический критерий проверки нулевой гипотезы
- •3.3. Критерий Пирсона проверки гипотезы о распределении генеральной совокупности.
- •4. Системы случайных величин
- •4.1. Двумерные св. Функция регрессии.
- •4.3. Выборочное уравнение линейной регрессии. Выборочный коэффициент корреляции.
- •Приложения
- •Литература
2.2.Статистическое распределение выборки
Пусть из генеральной совокупности извлечена выборка. При этом значение х1 наблюдалось n1 раз, х2 наблюдалось n2 раз и т.д. хk наблюдалось nk раз. Тогда общий объем выборки n можно определить как
Наблюдаемое значение хi называется вариантой, а их последовательность х1, х2,…, хk , записанная в неубывающем порядке, - вариационным рядом. Число наблюдений ni значения хi называется частотой, а значение его отношения к объему выборки – относительной частотой:
Разность между максимальным и минимальным вариантами хi СВ Х называется размахом выборки.
Статистическое распределение выборки называется перечень пар вариант и соответствующих им частот или относительных частот.
Пусть получено статистическое распределение выборки. Обозначим через nx число наблюдений, при которых значения вариант меньше, чем x. Эмпирической функцией распределения СВ называют функцию Fx* относительной частоты числа наблюдений nx
т.е. относительной частоты события X < x. Эта функция служит для приближенного представления о теоретической функции распределения СВ.
Полигоном частот называется ломаная, отрезки прямых которой соединяют точки (xi, ni). По оси абсцисс откладываются точки xi, а по оси ординат – частоты ni . Если вместо частот ni брать относительные частоты pi*, то можно построить полигон относительных частот по точкам (xi, pi*).
Когда рассматривается непрерывная СВ, которая может принимать любые, сколь угодно мало отличающиеся друг от друга значения, строится не полигон, а гистограмма. Для этого размах выборки, в котором заключены все варианты, разбивается на несколько интервалов длиной h каждый. На этих интервалах подсчитывается сумма частот вариант, попавших в i-й интервал, и составляется отношение ni / h .
Гистограммой называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат отрезки длиной h, а высоты равны отношению ni / h . Величина ni / h называется плотностью частоты.
Чтобы привести гистограмму, т.е. выборочную плотностью частоты, в соответствие с функцией плотности вероятности f(x) генеральной совокупности, по оси ординат откладывают величины ni /(hn). Тогда площадь под гистограммой будет равна единице.
2.3. Статистическое оценивание
На основе выборки можно получить лишь приближенные значения параметров генеральной совокупности, т.е. их оценки, так как эти оценки строятся на основе ограниченного набора данных. Естественно, значения оценок могут изменяться от выборки к выборке. Процесс нахождения оценок по определенному правилу называется оцениванием.
Выделяют два типа оценивания: оценивание вида распределения и оценивание параметров распределения.
В качестве оценки вида распределения можно взять выборочное распределение, а в качестве оценки Θ* теоретического параметра Θ распределения генеральной совокупности берутся их выборочные оценки.
Очевидно, что оценка Θ* является функцией от выборки х1, х2, …, хп, то есть Θn* = Θ*(х1,х2,…,хп). Поскольку выборка х1, х2, …, хп является реализацией случайных величин X1, X2, …, Xn и носит случайный характер, то оценка Θn* является СВ, принимающей различные значения для различных выборок. Любую оценку Θn*=Θ*(х1,х2,…,хп), полученную на основе выборки, называют статистической оценкой параметра Θ.
После определения оценок обычно встает вопрос об их качестве и статистической значимости.
Качество оценок характеризуется следующими основными свойствами: несмещенность, эффективность и состоятельность.
Оценка Θn* называется несмещенной оценкой параметра Θ, если ее математическое ожидание равно оцениваемому параметру: M(Θn*)= Θ.
Оценка Θn* называется эффективной оценкой параметра Θ, если ее дисперсия D(Θn*) меньше дисперсии любой другой выборки объемом n.
Оценка параметра Θ называется асимптотически эффективной, если с увеличением объема выборки ее дисперсия стремится к нулю, т.е.
D(Θn*) 0 при n .
Оценка n* называется состоятельной оценкой параметра Θ, если n* сходится по вероятности к Θ при n ,т.е. для любого 0 при n P(n* - < ) 1.
Иначе, состоятельной называется такая оценка, которая дает истинное значение при достаточно большом объеме выборки вне зависимости от значений входящих в нее конкретных наблюдений.