
- •Введение
- •Лабораторная работа № 1 Первичная обработка статистических данных
- •Основные теоретические сведения
- •1 Выборочный метод
- •2 Сгруппированный и интервальный статистические ряды
- •3 Эмпирическая функция распределения
- •4 Оценки числовых характеристик
- •Контрольные вопросы
- •2 Схема построения доверительных интервалов
- •3 Доверительные интервалы для математического ожидания и дисперсии случайной величины, имеющей нормальное распределение
- •Лабораторная работа № 3
- •2 Основные понятия статистической проверки гипотез
- •3 Применение критерия Пирсона 2 для проверки гипотезы о виде закона распределения случайной величины
- •4 Алгоритм применения критерия 2 для проверки гипотезы о виде закона распределения исследуемой случайной величины
- •2 Проверка гипотез о математическом ожидании случайной величины, имеющей нормальное распределение
- •3 Проверка гипотез равенства двух случайных величин, имеющих нормальное распределение
- •Лабораторная работа № 5 Построение регрессионной модели системы двух случайных величин
- •1 Введение
- •2 Регрессионный анализ
- •3 Метод наименьших квадратов
- •4 Пошаговый регрессионный анализ
- •5 Корреляционный анализ
- •6 Проверка значимости оценок коэффициентов корреляции и детерминации
- •Приложение а (справочное) Работа с пакетом statgraphics Plus for Windows
- •1 Запуск пакета statgraphics Plus
- •2 Создание файла выборок значений исследуемых величин
- •3 Использование существующего файла данных
- •4 Вычисление оценок числовых характеристик и построение гистограммы (столбцовой диаграммы) исследуемой случайной величины
- •5 Печать результатов статистического анализа
- •6 Определение доверительного интервала для математического ожидания и среднеквадратического отклонения случайной величины
- •7 Проверка гипотезы о значении математического ожидания случайной величины
- •8 Проверка гипотезы о значении математического ожидания случайной величины
- •9 Проверка непараметрической гипотезы о виде закона распределения исследуемой случайной величины
- •10 Построение диаграммы рассеяния
- •11 Регрессионный и корреляционный анализ
- •Приложение б (справочное) Критические точки распределения Стьюдента
- •Приложение в (справочное) Критические точки распределения 2
- •Приложение г (справочное) Таблица значений функции Лапласа
- •Приложение д (справочное) Критические точки распределения Фишера
- •Приложение ж (справочное) Критические точки стандартного нормального распределения
- •Приложение и (информационное) Рабочая программа по дисциплине «Теория вероятностей и математическая статистика»
- •1 Цели и задачи дисциплины, её место в учебном процессе
- •1.1 Цель преподавания дисциплины
- •1.2 Задачи изучения дисциплины
- •2.1.2 Одномерные случайные величины
- •2.1.3 Многомерные случайные величины
- •2.1.4 Основные понятия математической статистики
- •3 Учебно-методические материалы
- •Список принятых условных обозначений
- •Список литературы
- •Содержание
Лабораторная работа № 5 Построение регрессионной модели системы двух случайных величин
Цель работы: изучить основные методы регрессионного и корреляционного анализа; исследовать зависимость между двумя случайными величинами, заданными выборками.
Задание: по виду корреляционного поля сделать предположение о форме регрессионной зависимости между двумя случайными величинами; используя метод наименьших квадратов, найти параметры уравнения регрессии; оценить качество описания зависимости полученным уравнением регрессии.
Основные теоретические сведения
1 Введение
Часто в практике инженерных и научных исследований результат испытания характеризуется набором случайных величин, т. е. многомерной случайной величиной (МСВ). Например, погодные условия характеризуются температурой, давлением, влажностью, направлением и скоростью ветра; успеваемость студента определяется оценками по различным дисциплинам.
Многомерные случайные величины характеризуются многомерными (k‑мерными) законами распределения (заданными таблично, в виде функции распределения F(x1, x2, ..., xk) или плотности распределения f(x1, x2, ..., xk)) и числовыми характеристиками. Наряду с числовыми характеристиками, применимыми для одномерных с. в. (математическим ожиданием, дисперсией и др.), МСВ определяются дополнительными числовыми характеристиками, описывающими зависимость между ее компонентами.
В дальнейшем ограничимся рассмотрением двумерной с. в. (X, Y), компоненты X и Y которой фактически являются одномерными с. в.
Зависимость между случайными величинами, при которой каждому значению x случайной величины Х однозначно ставится в соответствие единственное значение y с. в. Y, называется функциональной. Например, зная напряжение U на участке электрической цепи сопротивлением R, можно однозначно определить величину тока (U = R I); зная скорость движения поезда V, можно однозначно определить время T его движения по перегону.
Однако часто на практике одному значению с. в. Х может соответствовать не одно, а множество значений с. в. Y, характеризуемых для каждого Х = х условным распределением с плотностью вероятностей f(y | Х = x). Такая зависимость называется статистической. Примером статистической зависимости является зависимость величины расхода топлива локомотивом (Y) от массы поезда (X), т.к. одному значению массы состава могут соответствовать различные значения расхода топлива (величина расхода топлива кроме массы состава обусловливается скоростью движения, профилем и состоянием пути, состоянием подвижного состава, направлением и скоростью ветра и прочими причинами).
Таким образом, при фиксированном значении xi влияющей величины X значения зависимой величины Y по-прежнему являются случайными и определяются условным законом распределения (при условии, что X = xi ). Изменение условного закона распределения с. в. Y при изменении значения Х может проявляться как при изменении вида распределения (рисунок 1, а), так и при изменении его числовых характеристик (рисунок 1, б), например, математического ожидания.
а) б)
Рисунок 1 – Примеры статистической зависимости: с изменением вида закона распределения (а), c изменением только лишь математического ожидания (б)
Если условный закон распределения (например f(y | Х = x)) одной из величин не изменяется при изменении значения другой случайной величины Х, то такие величины называются независимыми. Например, температура воздуха Y завтра в полдень не зависит от числа X, выпавшего на игральной кости (f(y | Х = 1) = f(y | Х = 2) =…= f(y | Х = 6)). Независимыми являются случайные величины, не связанные причинно-следственными связями.
Исследование зависимостей между случайными величинами является наиболее часто используемым приложением математической статистики (МС) и применяется главным образом для предсказания значения одной с. в. по значению другой.
Совместный закон распределения двух с. в. (F(x, y) и/или f(x, y)) как и статистическая зависимость между ними в вероятностном смысле полностью определяет зависимость между величинами. Однако получение такой информации является затруднительным. Поэтому в МС чаще ограничиваются изучением регрессионной зависимости, которая каждому значению одной с. в. ставит в соответствие условное математическое ожидание другой с. в. M[Y | X = x].
Изучением зависимости между с. в. занимается регрессионный и корреляционный анализ – разделы математической статистики. Предметом регрессионного анализа является нахождение вида уравнения регрессионной зависимости между случайными величинами. Предметом же корреляционного анализа является оценка тесноты связи между с. в., а также оценка качества описания зависимости выбранным уравнением регрессии.