- •Казанский кооперативный институт (филиал)
- •Теория вероятностей и математическая статистика конспект лекций
- •Общие организационно-методические рекомендации преподавателю
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Предмет и задачи теории вероятностей
- •2. Основные понятия теории вероятностей. События и соотношения между ними. Классификация событий
- •3. Частота и вероятность события. Способы определения вероятности
- •Аксиомы теории вероятностей
- •Лекция 2 Основные формулы для вычисления вероятностей
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Основные формулы для вычисления вероятностей
- •6. (Рисунок 4).
- •7. (Рисунок 5).
- •Задание на самостоятельную работу
- •Лекция 3 Основные теоремы теории вероятностей: сложение, умножение, формула полной вероятности
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Правила сложения вероятностей
- •2. Правила умножения вероятностей
- •3. Формула полной вероятности
- •1. Формула Байеса, вероятность появления хотя бы одного события
- •Лекция 5 Основные законы распределения дискретных случайных величин. Формула Бернулли
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Понятие о случайной величине и законе её распределения
- •Р исунок 1
- •Р исунок 3
- •2. Формы закона распределения случайной величины: ряд распределения, функция распределения, функция плотности распределения
- •3. Формула Бернулли
- •Задание на самостоятельную работу
- •Лекция 6 Основные законы распределения дискретных случайных величин. Локальная теорема Муавра-Лапласа, формула Пуассона
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Локальная теорема Муавра-Лапласа
- •2. Распределение Пуассона
- •Задание на самостоятельную работу
- •Лекция 7 Основные законы распределения дискретных случайных величин. Интегральная теорема Лапласа
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1.1 Определение вероятности попадания случайной величины х с использованием приведенной табличной функции распределения
- •1.2 Определение вероятности попадания случайной величины на заданный интервал с использованием табличной функции плотности распределения
- •1.3 Определение вероятности попадания случайной величины на заданный интервал с использованием таблиц приведенной функции Лапласа
- •Текст лекции
- •1. Понятие случайной величины
- •2. Законы распределения дискретных случайных величин
- •Задание на самостоятельную работу
- •Лекция 9 Числовые характеристики: математическое ожидание, дисперсия, среднеквадратическое отклонение
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Понятие о числовых характеристиках случайной величины
- •2. Числовые характеристики положения: математическое ожидание и его основные свойства
- •3. Числовые характеристики рассеивания: дисперсия, среднеквадратическое отклонение. Основные свойства дисперсии
- •Задание на самостоятельную работу
- •Лекция 10 Непрерывные случайные величины: функция распределения случайной величины
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Функция распределения непрерывной случайной величины для определения вероятности попадания случайной величины на интервал
- •1.1. Функция распределения непрерывной случайной величины
- •1.2. Свойства функции распределения
- •Задание на самостоятельную работу
- •Лекция 11 Плотность вероятности. Числовые характеристики. Моменты случайных величин
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Плотность распределения непрерывной случайной величины для определения вероятности попадания случайной величины на интервал
- •1.1. Плотность распределения
- •1.2. Свойства плотности распределения
- •2.5. Медиана
- •2.6. Начальный момент
- •2.7. Центральный момент
- •2.8. Коэффициент асимметрии
- •2.9. Эксцесс
- •Задание на самостоятельную работу
- •Лекция 12 Законы распределения непрерывных величин: нормальное, равномерное, показательное
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •1. Равномерное распределение
- •2. Показательное распределение
- •2.1. Функция надёжности
- •3. Нормальный закон распределения
- •3.1. Функция Лапласа
- •3.2. Правило трёх сигм
- •Задание на самостоятельную работу
- •Лекция 13 Понятие закона больших чисел
- •Литература:
- •Структура занятия и расчёт времени
- •Текст лекции
- •Закон больших чисел
- •1.1. Неравенство Чебышева
- •1.2. Теорема Чебышева
- •1.3. Теорема Бернулли
- •1.4. Теорема Пуассона
- •1.5. Предельные теоремы
- •1.6. Теорема Муавра – Лапласа
- •Текст лекции
- •1. Генеральная и выборочная совокупности
- •1.1. Статистическое описание результатов наблюдений
- •Текст лекции
- •1. Интервальные оценки параметров распределения. Непрерывное и дискретное распределения признаков
- •1.2. Интервальные оценки.
- •Текст лекции
- •1. Вариационные ряды
- •2. Построение интервального вариационного ряда
- •3. Графическое изображение вариационных рядов
- •4. Средние величины
- •5. Медиана и мода
- •6. Показатели вариации
- •7. Свойства эмпирической дисперсии
- •8. Эмпирические центральные и начальные моменты
- •9. Эмпирические асимметрия и эксцесс
- •Текст лекции
- •1. Доверительные вероятности, доверительные интервалы
- •Текст лекции
- •1. Корреляционный анализ
- •1.1. О связях функциональных и статистических
- •1.2. Определение формы связи. Понятие регрессии
- •1.3. Основные положения корреляционного анализа
- •1.4. Свойства коэффициента корреляции
- •1.5. Поле корреляции. Вычисление оценок параметров двумерной модели
- •1.6. Проверка гипотезы о значимости коэффициента корреляции
- •1.7. Корреляционное отношение
- •1.8. Понятие о многомерном корреляционном анализе
- •1.9. Ранговая корреляция
- •2. Регрессионный анализ
- •2.1. Основные положения регрессионного анализа
- •2.2. Линейная регрессия
- •2.3. Нелинейная регрессия
- •2.4. Оценка значимости коэффициентов регрессии. Интервальная оценка коэффициентов регрессии
- •2.5. Интервальная оценка для условного математического ожидания
- •2.6. Проверка значимости уравнения регрессии
- •2.7. Многомерный регрессионный анализ
- •2.8. Факторный анализ
- •Приложения
- •Функция Лапласа
- •Задание на самостоятельную работу
2. Регрессионный анализ
2.1. Основные положения регрессионного анализа
Основная задача регрессионного анализа — изучение зависимости между результативным признаком Y и наблюдавшимся признаком Х, оценка функции регрессий.
Предпосылки регрессионного анализа:
1) Y — независимые случайные величины, имеющие постоянную дисперсию;
2) X — величины наблюдаемого признака (величины не случайные);
3) условное математическое ожидание М(Y |Х=х) можно представить в виде
(2.1)
Выражение
(2.1), как уже упоминалось в п. 1.2, называется
функцией регрессии (или модельным
уравнением регрессии) Y
на X.
Оценке в этом выражении подлежат
параметры
и
,
называемые коэффициентами регрессии,
а также
—
остаточная дисперсия.
Остаточной дисперсией называется та часть рассеивания результативного признака, которую нельзя объяснить действием наблюдаемого признака; Остаточная дисперсия может служить для оценки точности подбора вида функции регрессии (модельного уравнения регрессии), полноты набора признаков, включенных в анализ. Оценки параметров функции регрессии находят, используя метод наименьших квадратов.
В
данном вопросе рассмотрен линейный
регрессионный анализ. Линейным он
называется потому, что изучаем лишь те
виды зависимостей
,
которые линейны по оцениваемым параметрам,
хотя могут быть нелинейны по переменным
X.
Например, зависимости
линейны относительно параметров
,
,
хотя вторая и третья зависимости
нелинейны относительно переменных х.
Вид зависимости
выбирают, исходя из визуальной оценки
характера расположения точек на поле
корреляции; опыта предыдущих исследований;
соображений профессионального характера,
основанных и знании физической сущности
процесса.
Важное место в линейном регрессионном анализе занимает так называемая «нормальная регрессия». Она имеет место, если сделать предположения относительно закона распределения случайной величины Y. Предпосылки «нормальной регрессии»:
1) Y — независимые случайные величины, имеющие постоянную дисперсию и распределенные по нормальному закону;
2) X — величины наблюдаемого признака (величины не случайные);
3) условное математическое ожидание M(Y\X=x) можно представить в виде (2.1).
В этом случае оценки коэффициентов регрессии — несмещённые с минимальной дисперсией и нормальным законом распределения. Из этого положения следует что при «нормальной регрессии» имеется возможность оценить значимость оценок коэффициентов регрессии, а также построить доверительный интервал для коэффициентов регрессии и условного математического ожидания M(Y\X=x).
2.2. Линейная регрессия
Рассмотрим
простейший случай регрессионного
анализа — модель вида (2.1), когда
зависимость
линейна и
по оцениваемым параметрам, и по переменным.
Оценки параметров модели (2.1)
и
обозначил
и
.
Оценку остаточной дисперсии
обозначим
.
Подставив в формулу (2.1) вместо параметров
их оценки, получим уравнение регрессии
,
коэффициенты которого
и
находят из условия минимума суммы
квадратов отклонений измеренных значений
результативного признака
от вычисленных по уравнению регрессии
или
Составим систему нормальных уравнений: первое уравнение
откуда
второе уравнение
откуда
Итак,
(2.2)
Оценки, полученные по способу наименьших квадратов, обладают минимальной дисперсией в классе линейных оценок. Решая систему (2.2) относительно и найдём оценки параметров и :
(2.3)
(2.4)
Остаётся получить оценку параметра . Имеем
(2.5)
где п — количество наблюдений.
Если
п
велико, то для упрощения расчётов
наблюдавшиеся данные принята группировать,
т.е. строить корреляционную таблицу.
Пример построения такой таблицы приведен
в п. 1.5. Формулы для нахождения коэффициентов
регрессии по сгруппированным данным
те же, что и для расчёта по несгруппированным
данным, но суммы
заменяют на
где
— частоты
повторений соответствующих значений
переменных. В дальнейшем часто используется
этот наглядный приём вычислений.
