
- •Федеральное агентство по образованию
- •Содержание
- •Введение
- •1. Графический способ обработки опытных данных
- •2.Элементы дисперсионного анализа
- •2.1. Сравнение нескольких средних. Понятие о дисперсионном анализе
- •2.2.Общая факторная и остаточная суммы квадратов отклонений
- •2.3. Связь между общей, факторной и остаточной суммами
- •2.4.Общая, факторная и остаточная дисперсии
- •2.5.Сравнение нескольких средних методом дисперсионного анализа
- •2.6.Неодинаковое число испытаний на различных уровнях
- •3.Элементы теории корреляции
- •3.1.Функциональная, статистическая и корреляционная зависимости
- •3.2.Парная корреляция. Коэффициент корреляции
- •3.3.Криволинейная корреляция
- •3.4.Множественная корреляция
- •4.Метод наименьших квадратов
- •5.Об ошибках измерений
- •Основная литература
- •Дополнительная литература
- •Воробьева Алла Викторовна
3.3.Криволинейная корреляция
Если линейная аппроксимация статистической зависимости между двумя величинами не отражает характер зависимости, используют модель криволинейной корреляции. Одной из распространенных является параболическая корреляция второго порядка, при которой уравнение регрессии Y на X имеет вид:
.
На практике выборка
совместного распределения случайных
величин X и
Y возникает
как последовательность пар
перечисленных в порядке произведенных
наблюдений, среди них могут быть и
одинаковые. Для нахождения коэффициентов
регрессии не обязательно группировать
данные в корреляционную таблицу.
Как и в случае
линейной корреляции, коэффициенты
регрессии
найдем из условия минимума функционала:
Условием минимума является обращение в нуль частных производных:
Это дает систему
трех линейных уравнений относительно
трех неизвестных
которая называется системой нормальных
уравнений:
Решая ее, получаем уравнение регрессии.
Отметим, что если ввести матрицу А и векторы у и а:
то в матричном виде систему нормальных уравнений можно записать как
А'Аа = А'у,
где А' – матрица, получаемая из матрицы А транспонированием.
Такая запись системы нормальных уравнений облегчает ее запоминание. Она переносится и на рассматриваемую далее множественную корреляцию.
Пример. Желая установить цену на товар, обеспечивающую максимальную прибыль, магазин в течении 5 рабочих дней недели продавал получаемые от поставщика изделия с наценкой 1, 2, 3, 4 и 5 у.е. При этом в каждый из дней было продано соответственно 100, 80, 60, 30 и 10 единиц товара. С помощью модели параболической регрессии второго порядка выбрать надбавку, дающую максимальную прибыль.
Решение. Выпишем таблицу соответствия между наценкой и полученной прибылью, определяемой как произведение наценки на количество проданного товара.
наценка Х |
1 |
2 |
3 |
4 |
5 |
прибыль Y |
100 |
160 |
180 |
120 |
50 |
Заметим, что устанавливаемая оценка по смыслу является величиной неслучайной. Прибыль, определяемая количеством проданного товара, напротив, величина случайная, среднее значение которой зависит от наценки. Уравнение регрессии Y на X ищем в виде:
Из полученной таблицы находим коэффициенты системы нормальных уравнений:
Система нормальных уравнений запишется в виде:
Произведя сокращение на 5, получим систему:
которую будем решать методом Гаусса.
Выборочное уравнение регрессии примет вид:
Даваемая моделью оптимальная наценка равна
а получаемая при такой наценке средняя ежедневная прибыль
Вычисленная по модели максимальная средняя ежедневная прибыль оказалась несколько меньше прибыли, полученной в день, когда наценка была равна 3. Это не должно вызывать недоумения. Согласно модели этот день был скорее случайной удачей, чем правилом.
На графике представлены значения полученных прибылей при различных наценках и полученная по ним параболическая линия регрессии.
3.4.Множественная корреляция
Пусть случайная
величина Y
зависит от величин
Такую корреляцию называют множественной.
Уравнение линейной множественной
регрессии ищется в виде:
.
Используемая
выборка состоит из n
наборов соответствующих
значений
величины Y,
где
Коэффициенты
находятся по выборке методом наименьших
квадратов.
Как и в случае
линейной парной регрессии, средние
значения
должны удовлетворять этом уравнению:
.
Это позволяет,
исключив коэффициент ,
записать уравнение регрессии в виде:
Такая запись уравнения весьма удобна и позволяет понизить на единицу порядок системы нормальных уравнений.
Пример.
В течение 7 месяцев фирма давала рекламу
своего товара по телевидению и в печати.
Ежемесячные расходы на рекламу (,
а также доход фирмы от продажи товара
(Y)
в тыс. у.е. сведены в таблице:
|
|
Y |
100 |
100 |
500 |
140 |
100 |
550 |
100 |
140 |
570 |
120 |
120 |
570 |
140 |
100 |
560 |
100 |
140 |
580 |
140 |
140 |
590 |
Получить по таблице уравнение регрессии
,
на основании которого предложить эффективную рекламную политику.
Решение. Уравнение регрессии будем искать в виде
Из таблицы находим:
Переопределенная
система линейных уравнений, даваемая
выборкой, примет вид:
После сокращения и удаления уравнения, не содержащего неизвестных, получаем:
Соответствующая нормальная система запишется в виде:
Ее решение:
Полученные значения коэффициентов
регрессии свидетельствуют о том, что
реклама по телевидению убыточна
,
а реклама в печати, наоборот, приносит
некоторый доход
.
Поэтому
относительно среднего уровня
вложения в рекламу по телевидению
следует снизить, направив освободившиеся
средства на рекламу в печати.