- •Теория вероятностей и математическая статистика
- •Содержание
- •Раздел 1. Элементы теории вероятностей
- •Глава 1. Случайные события
- •Предисловие
- •Раздел 1. Элементы теории вероятностей
- •Глава 1. Случайные события
- •1.1. Испытание, события, вероятность
- •1.2. Элементы комбинаторики
- •1.3. Алгоритм решения задачи на определение вероятности
- •Примеры решения задач.
- •1.4. Алгебра событий
- •1.5. Алгоритм решения задачи на алгебру событий
- •Пример решения задачи.
- •1.6. Формула полной вероятности. Формула байеса.
- •1.7. Схема испытаний бернулли
- •1.8. Приближенные формулы в схеме бернулли
- •Пример решения задачи.
- •1.9. Алгоритм решения задачи на схему бернулли
- •Глава 2. Случайные величины
- •2.1. Основные понятия
- •2.2. Числовые характеристики случайной величины
- •Примеры решения задач
- •2.3. Нормальное распределение непрерывной случайной величины
- •Пример решения задачи.
- •Раздел 2. Элементы математической статистики
- •Глава 3. Выборочный метод и статистическое оценивание
- •3.1. Предмет и основные задачи математической
- •Статистики
- •3.2. Статистический ряд
- •Пример решения задачи
- •3.3. Статистические оценки параметров распределения
- •3.4. Статистическая проверка статистических гипотез
- •3.5. Алгоритм проверки гипотезы о нормальном распределении генеральной совокупности
- •2) Вычислить среднее выборочное и исправленное стандартное отклонение и принять их в качестве точечных оценок и нормального распределения .
- •Пример решения задачи
- •Глава 4. Элементы корреляционного и регрессионного анализа
- •4.1. Линейная корреляционная зависимость.
- •4.2. Проверка гипотезы о значимости выборочного коэффициента корреляции
- •Контрольная работа №4
- •Вариант 0
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Учебно-методическое обеспечение дисциплины Основная литература
- •Дополнительная литература
- •Средства обеспечения освоения дисциплины
Глава 4. Элементы корреляционного и регрессионного анализа
4.1. Линейная корреляционная зависимость.
Два признака
X
и Y
находятся
в корреляционной зависимости, если
каждому значению одного из них
соответствует некоторое распределение
другого. Корреляционная зависимость
между признаками X
и Y
обычно
задается с помощью корреляционной
таблицы. Корреляционная зависимость
между признаками Y
и X
может быть
заменена функциональной, если каждому
значению признака X
поставить
в соответствие условное среднее признака
Y,
т.е. каждому
значению
поставить в соответствие величину
,
где
- частота пары
;
- частота значения
.
Если затем точки
выровнять
по методу наименьших квадратов ( см.
ниже ) вдоль некоторой линии, то эта
линия называется линией регрессии y
на x
, а ее уравнение
– уравнением регрессии y
на x.
Аналогично определяется линия регрессии x на y.
Пусть
-
двумерная случайная величина. С целью
предсказания значений случайной величины
Y
по фиксированным значениям случайной
величины X
исследуют
зависимость между случайными величинами
Y
и X
. Эта
зависимость может быть охарактеризована
функцией регрессии Y
на X:
,
где
-
математическое ожидание Y
при условии, что случайная величина X
приняла определенное значение x.
График функции
является
линией регрессии Y
на X
. Зная
,
можно делать прогноз ожидаемых средних
значений случайной величины Y
по фиксированным значениям случайной
величины X.
Как правило,
при обработке результатов наблюдений
распределение случайной величины
неизвестно.
Поэтому искомую зависимость стараются
охарактеризовать какой-нибудь эмпирической
формулой.
Для нахождения эмпирической формулы из множества значений случайной величины извлекается выборка объема n. Результаты выборки представляют в виде точек плоскости Oxy. Полученную точечную диаграмму называют корреляционным полем. При этом возможны два случая.
1) Точки на
корреляционном поле группируются вокруг
некоторой прямой линии. В этом случае
по опытным данным подбирают линейную
функцию регрессии:
2) Точки корреляционного
поля группируются вокруг некоторой
кривой
,
где
-
функция определенного вида (многочлен,
степенная, логарифмическая и т.д.).
Выбрав конкретную эмпирическую формулу для регрессии, подбирают параметры этой формулы методом наименьших квадратов.
Метод наименьших квадратов – это метод статистической оценки функциональной зависимости путем установления таких ее параметров, при которых сумма квадратов отклонений опытных данных от этой зависимости является минимальной.
Наиболее простыми и наиболее важными линиями регрессии являются прямые. Согласно методу наименьших квадратов для определения параметров а и b в случае линейной функции регрессии требуется решить систему уравнений:
.
Для измерения
линейной связи между величинами –
количественными признаками Y
и X,
служит также выборочный коэффициент
корреляции
,
который является точечной оценкой
коэффициента корреляции
генеральной совокупности.
Выборочный коэффициент линейной корреляции при построении линейной регрессионной зависимости Y на X вычисляют по формуле:
Значения коэффициента
линейной корреляции принадлежат отрезку
.
Если коэффициент принимает значение
1 или -1, то между признаками Y
и X
существует
линейная функциональная зависимость.
Если же значение коэффициента равно
нулю, то между величинами Y
и X
отсутствует
линейная корреляционная зависимость.
