- •Предисловие
- •Лист студента
- •Лист рецензии
- •Раздел 1. Теория вероятностей
- •Тема 1.1. События и вероятность
- •1.1.1. Элементы комбинаторики
- •1.1.2. События
- •1.1.3. Понятие вероятности
- •1. Статистическое определение вероятности.
- •2. Классическое определение вероятности.
- •1.1.4. Алгебра событий
- •1.1.5. Теорема сложения
- •1.1.6. Условные вероятности и теорема умножения
- •1.1.7. Формула полной вероятности. Формулы Байеса
- •Тема 1.2. Повторение испытаний (схема Бернулли)
- •1.2.1. Формула Бернулли
- •1.2.2. Формула Пуассона
- •1.2.3. Локальная формула Лапласа
- •1.2.4. Интегральная формула Лапласа
- •Тема 1.3. Случайные величины
- •1.3.1. Дискретные случайные величины
- •1.3.2. Непрерывные случайные величины
- •Тема 1.4. Законы распределения случайных величин
- •1.4.1. Биномиальное распределение
- •1.4.2. Геометрическое распределение
- •1.4.3. Распределение Пуассона
- •1.4.4. Равномерное распределение
- •1.4.5. Показательное (экспоненциальное) распределение
- •1.4.6. Нормальное распределение
- •Тема 1.5. Система двух случайных величин
- •1.5.1. Дискретные двумерные случайные величины
- •1.5.2. Функция распределения двумерной случайной величины
- •Основные свойства функции распределения:
- •1.5.3. Непрерывные двумерные случайные величины
- •Свойства плотности распределения:
- •1.5.4. Независимые и зависимые случайные величины. Коэффициент корреляции
- •Свойства коэффициента корреляции
- •Тема 1.6. Закон больших чисел
- •1.6.1. Неравенства Маркова и Чебышева
- •1.6.2. Закон больших чисел
- •Теорема Чебышева
- •Закон больших чисел
- •1.6.3. Теорема Бернулли
- •Теорема Бернулли
- •1.6.4. Понятие о центральной предельной теореме
- •Центральная предельная теорема
- •Тема 1.7. Цепи Маркова
- •1.7.1. Понятие марковского случайного процесса
- •1.7.2. Цепи Маркова с дискретным временем
- •1.7.3. Цепи Маркова с непрерывным временем
- •Правила составления системы дифференциальных уравнений Колмогорова
- •Раздел 2. Математическая статистика
- •Тема 2.1. Вариационные ряды и их характеристики
- •2.1.1. Генеральная и выборочная совокупности
- •2.1.2. Вариационный ряд и его графические изображения
- •2.1.3. Числовые характеристики вариационных рядов
- •Тема 2.2. Оценка параметров генеральной совокупности
- •2.2.1. Точечные оценки параметров
- •2.2.2. Основные законы распределения статистических оценок
- •2.2.2.1. Распределение «хи-квадрат»
- •2.2.2.2. Распределение Стьюдента
- •2.2.2.3. Распределение Фишера-Снедекора
- •2.2.3. Интервальные оценки параметров
- •Тема 2.3. Проверка статистических гипотез
- •2.3.1. Основные понятия и определения
- •2.3.2. Проверка гипотезы о равенстве средних значений
- •2.3.3. Проверка гипотезы о равенстве генеральных дисперсий
- •2.3.4. Проверка гипотезы о распределении генеральной совокупности. Критерии согласия
- •Тема 2.4. Однофакторный дисперсионный анализ
- •2.4.1. Понятие о дисперсионном анализе
- •2.4.2. Факторная и остаточная дисперсии и их отыскание
- •2.4.3. Сравнение нескольких средних методом дисперсионного анализа
- •Тема 2.5. Корреляционно-регрессионный анализ
- •2.5.1. Формы представления исходных для анализа данных
- •2.5.2. Выборочный коэффициент корреляции
- •Свойства выборочного коэффициента корреляции
- •2.5.3. Выборочное корреляционное отношение
- •2.5.4. Линейная регрессия
- •2.5.5. Статистический анализ уравнения регрессии
- •Литература
Тема 2.5. Корреляционно-регрессионный анализ
Как
показано в подразделе 1.5.4 настоящего
пособия, две случайные величины Х
и Y
могут быть связаны функциональной
зависимостью, когда связь между ними
может быть представлена в виде формулы
,
либо зависимостью другого рода, называемой
стохастической, либо могут быть
независимыми.
Строгая функциональная зависимость на практике реализуется сравнительно редко, поскольку либо обе рассматриваемые величины, или какая-то одна из них, подвержены воздействию многочисленных случайных факторов, среди которых могут быть и общие для обеих величин. В этом случае возникает стохастическая зависимость, которую в некоторых руководствах называют вероятностной, или статистической.
Стохастической называется зависимость двух случайных величин, при которой изменение одной из величин влечет изменение распределения другой величины.
Корреляционной называется стохастическая зависимость двух случайных величин, при которой изменение одной из величин влечет изменение среднего значения (математического ожидания) другой величины.
ПРИМЕР: Если величина Y – урожай сельскохозяйственной культуры, а величина Х – количество внесенных в почву удобрений, то с одинаковых по площади участков земли при равных количествах внесенных удобрений в общем случае снимают различный урожай, т.е. величина Y не является функцией аргумента Х. Это объясняется воздействием случайных факторов: осадки, качество почвы и т.д.. Однако, как показывают опыты, средний урожай (по всем участкам) зависит от количества внесенных удобрений, т.е. рассматриваемые величины связаны корреляционной зависимостью.
Поскольку
условное математическое ожидание
величины Y
при постоянном значении величины Х,
т.е.
является функцией от
,
то его оценка – условное среднее
также является функцией от
.
Если обозначить эту функцию через
,
то получим уравнение
,
которое называется выборочным
уравнением регрессии Y
на Х.
Заметим, что из аналогичных рассуждений можно определить и выборочное уравнение регрессии Х на Y.
Основной задачей корреляционно-регрессионного анализа является выявление наличия и характера связи между переменными Х и Y, определение параметров функции регрессии, а также количественная оценка тесноты этой связи.
2.5.1. Формы представления исходных для анализа данных
Простейшим
случаем представления исходных данных
являются не сгруппированные данные,
т.е. набор пар чисел
,
где
есть выборка значений величины Х,
а
есть выборка значений величины Y.
Однако при сравнительно большом числе наблюдений одна и та же пара значений может встречаться несколько раз. Поэтому в таких случаях данные наблюдений группируют и представляют в виде корреляционной таблицы. Поясним структуру такого представления исходных данных на конкретном примере.
Для исследования зависимости годового объема производства Y от основных фондов Х получены статистические данные по 20 предприятиям, представленные в корреляционной таблице 2.1.
Таблица 2.1.
-
12,5
17,5
22,5
27,5
20,5
1
-
-
-
1
21,5
-
2
-
-
2
22,5
-
1
2
-
3
23,5
-
-
3
3
6
24,5
-
-
-
8
8
1
3
5
11
n = 20
В
первой строке таблицы записаны значения
переменной Х,
а в первом столбце – значения переменной
Y.
Центральную (выделенную) часть таблицы
занимают частоты
(числа предприятий), соответствующие
значениям переменных
и
.
В последней строке таблицы записаны
частоты
,
а в последнем столбце –
частоты
.
Здесь число значений величины Х:
,
а число значений величины Y:
.
При этом общее число всех значений
.
