- •Введение
- •Тема 1. Определение вероятности и правила ее вычисления
- •Свойства вероятности
- •Задание 1 Варианты
- •Задание 2 Варианты
- •Тема 2. Независимые испытания бернулли. Теоремы муавра - лапласа и пуассона.
- •Задание 3 Варианты
- •Тема 3. Одномерные случайные величины (св) и их числовые характеристики
- •Основные свойства функции распределения.
- •Свойства математического ожидания.
- •Свойства дисперсии.
- •Задание 4
- •Варианты
- •Тема 4. Многомерные случайные величины
- •Задание 5
- •Варианты
- •Тема 5. Элементы математической статистики. Статистическая оценка параметров распределения
- •Задание 6
- •Тема 6. Марковские случайные процессы
- •Задание 7
- •Варианты
- •Тема 7. Элементы теории массового обслуживания
- •Задание 8 Варианты
Тема 5. Элементы математической статистики. Статистическая оценка параметров распределения
1. Генеральная и выборочные совокупности.
2. Статистическое распределение случайной величины.
3. Эмпирическая функция распределения. Графическое изображение статистических рядов.
4. Классификация точечных оценок. Метод моментов и метод наибольшего правдоподобия.
5. Доверительная вероятность, доверительный интервал. Интервальные оценки параметров распределения.
6. Статистический критерий значимости проверки нулевой гипотезы.
7. Статистическая проверка гипотез о параметрах распределения (математическом ожидании, равенстве математических ожиданий, дисперсии).
8. Статистическая
проверка непараметрических гипотез.
Критерии согласия
и Колмогорова.
9.Статистическая зависимость. Линейная регрессия. Метод наименьших квадратов.
10. Эмпирический коэффициент корреляции и его свойства.
Между составляющими
двумерной
может существовать зависимость, не
носящая функциональный характер. В этом
случае мы не можем говорить о том, какое
значение принимает одна составляющая,
если вторая приняла некоторое конкретное
значение, но мы можем говорить о законе
распределения (условном) одной
составляющей, если известно, какое
значение приняла вторая. Такая зависимость
называется статистической.
В практических приложениях при исследовании статистической зависимости СВ Х и Y рассматривают зависимость между значениями одной из них X и условным математическим ожиданием другой
(5.1)
Уравнение (5.1) называется модельным уравнением регрессии Y на X . Если эта зависимость линейная, т.е.
, (5.2)
то регрессия называется линейной.
Поскольку модельное уравнение регрессии неизвестно, то для его оценки используют эмпирическое уравнение регрессии
, (5.3)
где коэффициенты
и
находят
по результатам выборки
объема
методом наименьших квадратов, а именно
и
выбирают
так, чтобы они минимизировали функцию
.
Используя
необходимые условия экстремума
,
получают, систему уравнений:
И далее:
(5.4)
где
Решая
систему (5.4), получим
. (5.5)
После подстановки в формулу (5.3) значений и из (5.5) она примет вид:
,
где
(5.6)
Число
является выборочным коэффициентом
корреляции,
.
При этом число
(5.7)
называется коэффициентом детерминации.
Другая формула
для
:
. (5.8)
Поэтому
показывает долю разброса результатов
наблюдений
относительно прямой
,
которая объясняется выборочной регрессией
(5.3). При этом числа
в
формуле (5.8) называются остатками,
а число
(5.9)
- остаточной суммой квадратов.
Числа
и
,
полученные по методу наименьших квадратов
являются несмещенными оценками параметров
и
из (5.2), то есть
.
Число
(5.10)
называется остаточной дисперсией.
В качестве примера рассмотрим задачу из задания 5, исходные данные возьмем для варианта 31*(см. ниже).
Пример 5.1.
Решение. 1) Зависимость между X и Y будем искать в виде . Параметры и модели найдем из системы (5.4):
Тогда по формуле (5.5)
Из первого уравнения
.
Итак, уравнение
прямой линии регрессии Y
на x:
.
Вспомогательные вычисления соберем в таблицу.
xi |
yi |
xiyi |
xi2 |
yi2 |
ei2 |
4 |
2 |
8 |
16 |
4 |
0,2025 |
4,5 |
3 |
13,5 |
20,25 |
9 |
0,057121 |
5,5 |
3 |
16,5 |
30,25 |
9 |
0,146689 |
6 |
4 |
24 |
36 |
16 |
0,0936 |
6,5 |
4 |
26 |
42,25 |
16 |
0,00003 |
7 |
5 |
35 |
49 |
25 |
0,4679 |
7,2 |
5 |
36 |
51,84 |
25 |
0,31315 |
7,8 |
4 |
31,2 |
60,84 |
16 |
0,66194 |
8 |
5 |
40 |
64 |
25 |
0,00384 |
10 |
6 |
60 |
100 |
36 |
0,03313 |
=66,5 |
=41 |
=290,2 |
=470,43 |
=181 |
Qe=1,9799 |
|
|
|
|
|
s2=0,2475 |
2) Построим корреляционное поле и график ,
.
График линии регрессии
3) Вычислим
коэффициент корреляции
по формуле (5.4) и коэффициент детерминации
:
4) Коэффициент детерминации
(с
точностью до 0,01).
Поэтому 85% рассеивания зависимой переменной Y объясняется линейной регрессией Y на X, а 15% рассеивания Y остались необъясненными.
5) По формуле (5.9):
.
6) По формуле (5.10):
.
7) Подставим точку
в уравнение
,
(с точностью до 0,01).
8) Вычислим
по формуле (5.8), при этом используя
равенство
(с точностью до
0,01).
9) Если
;
то
,
т.е. при энерговооруженности
тыс. кВт час в год/ч можно ожидать среднюю
производительность
(тыс.изд.
в год/ч).
