
- •Авторы-составители:
- •1.Цели и задачи дисциплины
- •1). Цель, задачи, структура дисциплины и ее место в учебном процессе.
- •Требования к уровню освоения содержания дисциплины
- •Объем дисциплины Объем дисциплины и виды учебной работы Распределение часов по темам и видам учебной работы
- •4. Содержание курса
- •1. Основные понятия, определения и теоремы теории вероятностей* Введение
- •1.1. Алгебра событий. Основые понятия теории множеств
- •1.2. Основные определения: испытание, событие. Классификация событий
- •1.3. Классическое определение вероятности. Свойства, вытекающие из этого определения
- •Значение вероятности
- •1.4. Основные теоремы теории вероятностей
- •1.5. Зависимые и независимые события
- •2. Формула полной вероятности и формула Бейеса
- •2.1. Формула полной вероятности
- •3. Случайные величины
- •3.1. Дискретные случайные величины
- •Ряд распределения случайной величины X
- •3.4. Ожидаемое среднее значение дискретной случайной величины
- •Вычисление математического ожидания числа рекламных
- •3.5. Свойства математического ожидания случайной дискретной величины
- •Возможные исходы лотереи
- •3.6. Ожидаемое среднее значение функции случайной величины
- •Ряд распределения числа месячных продаж
- •К вычислению среднего ожидаемого значения
- •3.7. Дисперсия дискретной случайной величины
- •К вычислению дисперсии случайной величины
- •3.9. Дисперсия линейной функции случайной величины
- •4. Законы распределения дискретных случайных величин
- •Формула Бернулли. Биномиальные вероятности
- •4.3. Биномиальный закон распределения
- •Биномиальное распределение
- •Биномиальное распределение X – числа гербов, появляющихся
- •Фрагмент таблиц ряда и функции биномиального распределения
- •Биномиальное распределение числа покупателей
- •Распределения
- •4.5. Распределение Пуассона
- •Закон распределения Пуассона
- •Сравнение вероятностей, полученных по формулам Бернулли и Пуассона
- •4.6. Гипергеометрическое распределение
- •Гипергеометрический закон распределения
- •Биномиальный закон распределения
- •Гипергеометрическое распределение
- •4.7. Производящая функция
- •4.8. Мультиномиальное распределение
- •4.9. Геометрическое распределение
- •5. Непрерывные случайные величины
- •6. Законы распределения непрерывных случайных величин
- •7. Закон больших чисел
- •7.1. Принцип практической уверенности. Формулировка закона больших чисел
- •7.2. Неравенства Маркова и Чебышева
- •Выражения (7.1–7.2) справедливы для дискретных и непрерывных случайных величин.
- •7.4. Теорема Бернулли
- •7.5. Теорема Пуассона
- •Контрольные задания по курсу теории вероятностей Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •Вариант 11
- •Вариант 12
- •Вариант 13
- •Вариант 14
- •Вариант 15
- •Вариант 16
- •Вариант 17
- •Вариант 18
- •Вариант 19
- •Вариант 20
- •Вариант 21
- •Вариант 22
- •Вариант 23
- •Вариант 24
- •Вариант 25
- •Вариант 26
- •Вариант 27
- •Вариант 28
- •Вариант 29
- •Вариант 30
- •Вариант 31
- •Вариант 32
- •Вариант 33
- •Вариант 34
- •Вариант 35
- •Вариант 36
- •Вариант 37
- •Вариант 38
- •Вариант 39
- •Вариант 40
- •Математическая статистика Теория вероятностей и математическая статистика – основной инструментарий для прикладной статистики
- •Дисперсией случайной величины х называется число dx , равное математическому ожиданию квадрата отклонения случайной величины от своего математического ожидания: . (1.4)
- •Контрольные вопросы и задачи
- •Статистическое оценивание
- •Интервальная оценка для генеральной доли
- •Контрольные вопросы и задачи
- •Тема 3. Статистическая проверка гипотез
- •Общая логическая схема статистического критерия.
- •Проверка гипотезы о значении генеральной средней
- •Проверка гипотезы о значении дисперсии генеральной совокупности
- •Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события
- •Гипотеза об однородности рада вероятностей
- •Гипотезы о виде законов распределения генеральной совокупности
- •Контрольные вопросы и задачи
- •Тема 4. Методика статистического анализа количественных и качественных показателей
- •Контрольные вопросы и задачи
- •Тема 5. Многомерные статистические методы
- •Темы практических и семинарских занятий, тематических дискуссий
- •Задания для самостоятельной работы студентов
- •1.Методы анализов рядов динамики. Особенности моделирования рядов динамики с помощью корреляционного - регрессионного анализа
- •2. Понятие о закономерности распределения. Изучение формы распределения
- •3. Матрицы и таблицы сопряженности
- •4.Понятие о статистическом графике. Элементы статистического графика
- •5. Классификация видов графика: диаграммы сравнения, структурные диаграммы и диаграммы динамиков. Статистические карты
- •6. Условия типичности средних величин
- •7. Понятие малой выборки и методы расчета ее средней ошибки
- •8. Основные направления применения выборочного наблюдения в социально-экономических исследованиях
- •9. Взаимосвязи социально-экономических явлений и процессов, задачи их статического изучения.
- •10. Роль качественного анализа в исследовании связей
- •11. Основные статистические методы изучения связей в торговле и сфере услуг: метод параллельных данных, метод аналитических группировок, графический метод, балансовый метод.
- •12.Применение дисперсионного анализа в экономико-статистических исследованиях
- •13. Регрессионное уравнение как форма аналитического выражения статистических связей
- •14. Способы отбора факторных признаков при построении регрессионных моделей
- •15. Оценка результатов корреляционно-регрессионного анализа
- •7.Темы курсовых/контрольных работ/рефератов Варианты контрольных работ для студентов заочной формы обучения всех специальностей Вариант первый
- •Вариант второй
- •Вариант третий
- •Вариант четвертый
- •Вариант пятый
- •Вариант шестой
- •Вариант седьмой
- •Учебно-методическое обеспечение Литература:
- •16. Елисеева и.И., Юзбашев м.М. – Общая теория статистики. Учебник - м.: Финансы и статистика, 2005. Материально-техническое и информационное обеспечение дисциплин
Контрольные вопросы и задачи
1.1. Даны случайные величины X и Y, причем Х=5Y+6. Дисперсия случайной величины Y равна D(Y). Выберите правильное значение D(X):
1) D(Y) 2) 5D(Y) + 6 3) 25 D(Y) 4) D(Y)
1.2. Известно, что M(X)=6, M(Y)=7. Определите М(XY).
1.3. Если эксцесс больше нуля, то:
1) вариационный ряд имеет более крутую вершину по сравнению с нормальной кривой;
2) вариационный ряд имеет более пологую вершину по сравнению с нормальной кривой.
1.4.
В результате расчетов определены
выборочное среднеквадратическое
отклонение s=0,031
и выборочные моменты
=
-0,001 и
=0,0018.
Рассчитайте коэффициент асимметрии и
эксцесс.
1.5.
Даны начальные моменты
=3,4;
=11,5;
=40,4;
=144,3.
Определите центральные моменты
,
,
.
1.6. Медиана является:
1) 0,25 –квантилью 2) 0,5 –квантилью 3) 0,75 -квантилью
Статистическое оценивание
В самом общем смысле статистическое оценивание параметров можно рассматривать как совокупность методов, позволяющих делать научно обоснованные выводы о числовых параметрах генеральной совокупности по случайной выборке из нее.
Генеральной совокупностью называют множество результатов всех мыслимых наблюдений, которые могут быть получены при данном комплексе условий.
Выборочной совокупностью (выборкой) называют множество результатов, случайно отобранных из генеральной совокупности.
Задачи математической статистики практически сводятся к обоснованному суждению об объективных свойствах генеральной совокупности по результатам случайной выборки.
Любая функция θ(Х1, Х2,…,Хn) от результатов наблюдения Х1, Х2,…,Хn случайной величины Х называется статистикой.
Статистика
,
используемая в качестве приближенного
значения неизвестного параметра θ,
называется статистической оценкой.
Основная задача теории оценивания
состоит в том, чтобы произвести выбор
оценки
параметра θ,
позволяющей получить хорошее приближение
оцениваемого параметра.
Все статистики и статистические оценки являются случайными величинами: при переходе от одной выборки к другой (даже в рамках одной и той же генеральной совокупности) конкретные значения статистической оценки будут подвержены неконтролируемому разбросу. Параметры генеральной совокупности есть постоянные величины.
Методы статистического оценивания состоят из двух больших разделов: точечное оценивание параметров и интервальное оценивание.
Точечной оценкой называют некоторую функцию результатов наблюдения θ(Х1, Х2,…,Хn), значение которой принимается за наиболее приближенное в данных условиях к значению параметра θ генеральной совокупности. Точечная оценка должна отвечать требованиям состоятельности, несмещенности и эффективности.
Существуют следующие основные методы точечного оценивания случайных величин: метод максимального (наибольшего) правдоподобия; метод моментов; метод наименьших квадратов.
Метод
максимального правдоподобия.
В
соответствии с этим методом оценка
мп
неизвестного параметра θ
по наблюдениям Х1,
Х2,…,Хn
случайной
величины Х (подчиненной закону
распределения f
(X,
),
где f
– плотность
вероятности) определяется из условия
L(Х1,
Х2,…,Хn;
мп
)=
L(Х1,
Х2,…,Хn;
) (2.1)
где L – функция правдоподобия.
Если переписать
функцию L
в виде L
=
, (2.2)
тогда логарифм
этой функции
L
=
- (2.3)
есть логарифмическая функция максимального правдоподобия.
Функция максимального правдоподобия максимизирует количественную оценку для оценки истинного параметра θ. При этом оценка выбирается таким образом, что реализация функции (2.2) или эквивалентной ей функции (2.3) будет иметь наибольшее значение. Доказано, что оценки максимального правдоподобия являются состоятельными, асимптотически-несмещенными, асимпточески-нормальными и асимптотически-эффективными.
Метод моментов. Метод моментов заключается в приравнивании определенного количества выборочных моментов к соответствующим теоретическим (т.е. вычисленным с использованием функции f (X, )) моментам исследуемой случайной величины, причем последние являются функциями от неизвестных параметров θ(1),…, θ(k). Рассматривая количество моментов, равное числу k подлежащих оценки параметров, и решая полученные уравнения относительно этих параметров, получаются искомые оценки. Доказывается, что оценки неизвестных параметров, полученные методом моментов, являются состоятельными. В силу сравнительно простой вычислительной реализации метод моментов удобен на практике.
Метод наименьших квадратов используется в регрессионном анализе для нахождения оценок параметров уравнения регрессии. Метод состоит в том, чтобы определить оценку неизвестного параметра из решения следующей задачи:
min
, (2.4)
где xi – результаты выборочных наблюдений.
Можно показать,
что данный функционал достигает своего
минимума при таком значении
,
при котором обращается в нуль первая
производная:
.
В случае линейных связей, когда наблюдения содержат лишь случайные ошибки (без систематических), оценки, полученные методом наименьших квадратов, являются несмещенными линейными функциями от наблюденных значений. Если ошибки наблюдения независимы и подчиняются нормальному распределению, оценки, полученные данным методом, являются также эффективными.
Несмещенность. Оценка неизвестного параметра θ называется несмещенной, если при любом объеме выборки n результат ее осреднения по всем возможным выборкам данного объема приводит к точному истинному значению оцениваемого параметра, т.е. М =θ. (2.5)
Выполнение требования несмещенности гарантирует отсутствие систематической ошибки в оценке параметра. Разность М и θ называется смещением оценки.
Оценка
называется
асимптотически несмещенной,
если ее смещенность исчезает при условии
n
,т.е.
справедливо следующее равенство
(М
)
= θ.
(2.6)
Эффективность. Эффективной оценкой неизвестного параметра θ называется такая несмещенная оценка, которая обладает наименьшей дисперсией среди всех возможных несмещенных оценок параметра θ для данного объема выборки n.
Данное выше определение опирается на понятие абсолютной эффективности. Несмещенная оценка является абсолютно эффективной, если она достигает нижнюю границу эффективности, задаваемую неравенством Крамера-Рао.
Var
M
,
(2.7)
где M - количество информации, содержащейся в выборке. - несмещенная оценка параметра θ, L – функция правдоподобия, Var – знак дисперсии, M – знак математического ожидания.
Очевидно, что для абсолютно эффективной оценки неравенство (2.7) превращается в равенство. Можно также ввести понятие относительной эффективности.
Для двух несмещенных оценок 1 и 2 оценка 1 будет более эффективной, если при прочих равных условиях выполняется неравенство:
var( 1 ) < var( 2) (2.8)
Мерой эффективности оценки служит средняя квадратическая ошибка, задаваемая следующей формулой: σ = М{( - θ)2} (2.9)
Оценку 1 называют асимптотически более эффективной, чем оценка 2, если:
var(
1)
var(
2)
(2.10)
Cостоятельность.
Оценка
неизвестного параметра θ
называется состоятельной, если по мере
роста числа наблюдений n
(т.е. при
n
)
она стремится по вероятности к оцениваемому
значению θ,
т.е. если для любого сколь угодно малого
ε>0 выполняется условие P
>
ε
. (2.11)
В теории доказывается, что средняя арифметическая является несмещенной, состоятельной и эффективной оценкой математического ожидания .
Выборочная дисперсия
является
состоятельной, эффективной, но смещенной
оценкой
генеральной дисперсии
.
Несмещенной
оценкой дисперсии генеральной совокупности
будет исправленная выборочная дисперсия
:
=
,
(2.12)
где дробь
-
является поправкой Бесселя. C
ростом
поправка стремится к нулю и уже при
>50
практически нет никакой разницы между
и
.
Законы распределения выборочных характеристик
Распределение
Пирсона (
распределение).
Если Х1,
Х2,…,Хn
есть ряд
независимых, нормированных, нормально
распределенных случайных величин
,
т.е.
и
для
,
то случайная величина
(2.13)
имеет распределение
с
степенями
свободы, где
-единственный
параметр распределения, характеризующий
число случайных величин в выражении
().
Математическое
ожидание и дисперсия (
распределения)
задаются следующими выражениями:
(2.14)
Распределение
Стьюдента (
-
распределение). Если
случайная величина Z
имеет нормированное нормальное
распределение
,
а величина
имеет
распределение
с
степенями
свободы, причем Z
и U
взаимно независимы, то случайная величина
(2.15)
имеет - распределение с степенями свободы.
Математическое
ожидание и дисперсия (
-распределения)
задаются следующими выражениями:
(2.16)
Распределение
Фишера-Снедекора. Пусть
имеется две независимые случайные
величины X
и Y,
подчиняющиеся нормальному закону
распределения. Произведены две независимые
выборки объемами
и
и
вычислены выборочные дисперсии
и
.
Известно, что случайные величины
и
имеют распределение
с
соответственно
и
степенями свободы. Случайная величина
(2.17)
имеет F-распределение
с
и
,
причем
.
F-распределение
не зависит от неизвестных параметров
и
,
а зависит от числа наблюдений в выборках
и
.
Математическое
ожидание и дисперсия (
-распределения)
задаются следующими выражениями:
(2.18)
Интервальной
оценкой
называют доверительный интервал
(
-
,
+
),
определяемый по результатам выборки,
относительно которого можно утверждать
с определенной, близкой к единице
вероятностью, что он заключает в себе
истинное значение оцениваемого параметра
генеральной совокупности, т.е.
Р( - θ + ) =γ, (2.19)
где - и + и – соответственно нижняя и верхняя границы доверительного интервала. Вероятность γ называется доверительной вероятностью.
Параметр задает точность интервальной оценки. Ширина доверительного интервала h определяется по формуле: h = 2 . (2.20)
Доверительный интервал по своей природе случаен. Ширина доверительного интервала существенно зависит от объема выборки n (уменьшается с ростом n) и от величины доверительной вероятности (увеличивается с приближением доверительной вероятности к единице).
Интервальные оценки для генеральной средней
Дисперсия
генеральной совокупности известна.
Пусть
из генеральной совокупности Х с нормальным
законом распределения N(μ;σ)
и известным генеральным средним
квадратическим отклонением взята
случайная выборка Х1,
Х2,…,Хn
объемом n
.
Для нахождения интервальной оценки μ
используем среднюю арифметическую,
которая имеет нормальное распределение
с параметрами N(μ;
).
Статистика
имеет нормированное нормальное
распределение с параметрами N(0;1).
Вероятность любого отклонения
может быть вычислена по интегральной
теореме Лапласа для интервала,
симметричного относительно μ по формуле:
Р{(
)<t
γ
}=Ф(t)
(2.21)
Задавая определенную доверительную вероятность γ по таблице интегральной функции Лапласа Ф(t), можно определить значение t γ.
Преобразовав
формулу (1.13), будем иметь доверительный
интервал для математического ожидания:
Р{
t
γ
+ t
γ
}=
Ф(t)
(2.22)
Точность оценки равна = t γ (2.23)
Дисперсия
генеральной совокупности неизвестна.
Пусть имеется
генеральная совокупность Х, распределенная
по нормальному закону N(μ;σ),
c
неизвестным средним квадратическим
отклонением σ. По результатам выборки
объема n
из генеральной совокупности вычислены
средняя арифметическая х и выборочное
среднее квадратическое отклонение S.
В этом случае для построения интервальной
оценки генеральной средней μ
используется
статистика
,
имеющая распределение Стьюдента с
числом степеней свободы ν=n-1.
По таблице t – распределения Стьюдента для ν=n-1 степеней свободы находим значение tα,η , для которого справедливо равенство
Р{
tα,η
+ tα,η
}=
γ
(2.24)
Точность оценки
равна
=
tα,η
(2.25)
Интервальные оценки для генеральной дисперсии и среднего квадратического отклонения
Пусть из генеральной совокупности Х, распределенной по нормальному закону N(μ;σ), взята случайная выборка объемом n и вычислена выборочная дисперсия S2. Требуется определить с надежностью γ интервальные оценки для генеральной дисперсии σ2 и среднего квадратического отклонения σ.
Для построения
доверительного интервала при объеме
выборки n
обычно
используется статистика
,
имеющая распределение Пирсона с ν=n-1.
Выбирая уровень доверительной вероятности γ можно записать
Р{
}=1-
α (2.26)
Далее по таблице
- распределения можно выбрать такие два
значения
и
,
чтобы площадь, заключенная под
дифференциальной функцией распределения
между
и
,
была равна γ=1- α.
Обычно
и
выбирают так, чтобы Р(
<
)=Р(
>
)=
,
(2.27)
Проведя
соответствующие преобразования и
учитывая то, что таблица
-распределения
содержит значения только для Р(
>
),
окончательно получаем:
,
(2.28)
причем Р( )=Р( > )=1- ; (2.29)
Р( )=Р( > )= .
Доверительный
интервал для генерального среднего
квадратического отклонения равен
.
(2.30)
При достаточно больших объемах выборки (n>30) доверительный интервал для генерального среднего квадратического отклонения определяется по формуле:
.
(2.31)