
- •Глава 1. Применение математического ожидания и стандартного
- •Глава 2. Линейная регрессия стр. 5
- •Глава 3. Временные ряды стр. 20
- •Глава 1. Применение математического ожидания и стандартного отклонения для оценки риска
- •Глава 2. Линейная регрессия
- •1. Простая модель линейной регрессии
- •2. Ошибки
- •3. Коэффициент корреляции пирсона. Коэффициент детерминации
- •4. Предсказания и прогнозы на основе линейной модели регрессии
- •5. Основные предпосылки модели парной линейной регрессии
- •6. Процедура испытания гипотез
- •7. Испытание гипотезы для оценки линейности связи
- •7.1. Испытание гипотезы для оценки линейности связи на основе оценки коэффициента корреляции в генеральной совокупности
- •7.2. Испытание гипотезы для оценки линейности связи на основе показателя наклона линейной регрессии
- •8. Доверительные интервалы в линейном регрессионном анализе
- •9. Регрессия и ms excel
- •Глава 3. Временные ряды
- •1. Анализ аддитивной модели
- •2. Анализ мультипликативной модели
- •3. Преимущества и недостатки метода скользящей средней
- •Список вопросов для зачета
4. Предсказания и прогнозы на основе линейной модели регрессии
Мы можем воспользоваться построенной моделью для нахождения значения у при известном значении х. Модель строилась по значениям x1, x2, …, xn. Поэтому поиск значения у для х из интервала (х1, xn) называется предсказанием, а поиск значения у для x вне интервала (х1, xn) называется прогнозом. Чем дальше расположен x от интервала (х1, xn), тем менее точным будет прогноз.
Пример 3. Найдем ожидаемое значение себестоимости y при выпуске продукции x = 5,5 тыс. шт.
y = 2,12 – 0,11x.
Тогда y(5,5) = 2,12 – 0,11 ∙ 5,5 = 1,515 тыс. руб.
Замечание. Для прогноза значений переменной у можно воспользоваться статистической функцией ТЕНДЕНЦИЯ (изв_знач_y; изв_знач_x; нов_знач_х; константа) мастера функций fx пакета Ехсе1. Нов_знач_х – это ссылка на ячейки, содержащие значения переменной x, для которых ищется прогноз. Если необязательный аргумент константа = 0, то коэффициент a = 0. По известным значениям переменных x, y функция сама подбирает уравнение прямой линии и дает прогноз. Функцию ТЕНДЕНЦИЯ можно использовать и в случае множественной линейной регрессии. Для парной линейной регрессии можно воспользоваться и статистической функцией ПРЕДСКАЗ (х; изв_знач_y; изв_знач_x), где x – это значение переменной x, для которого ищется прогноз.
5. Основные предпосылки модели парной линейной регрессии
1. Связь между переменными х, у является линейной.
2. Независимая переменная х может быть использована для прогноза у.
3. Остатки (то есть ошибки) нормально распределены.
4. Для всех данных х математическое ожидание ошибки равно нулю и дисперсия ошибки постоянна.
5. Ошибки независимы.
6. Процедура испытания гипотез
Очень часто генеральная совокупность должна подчиняться некоторым параметрам. Например, фасовочная машина должна наполнять пакеты сахаром по 1 кг. Как узнать, действительно ли генеральная совокупность подчиняется этим ограничениям? С этой целью проводят испытание гипотез.
Из генеральной совокупности проводят выборку объема n. Для этой выборки вычисляют нужные характеристики. Затем формулируют две гипотезы: основную H0 и альтернативную H1. Основная гипотеза H0 – это то утверждение, которое подлежит проверке.
Например, гипотеза H0: генеральная средняя a = 2. Альтернативная гипотеза H1 в этом примере может быть сформулирована любым из следующих трех способов:
а) H1: a > 2 (правосторонняя проверка);
б) H1: a < 2 (левосторонняя проверка);
в) H1: a ≠ 2 (двусторонняя проверка).
Исследователь задает доверительную вероятность p – величину, которая отражает степень уверенности исследователя в результате испытания. Для односторонней проверки α = 1 – p, для двусторонней проверки α = (1 – p)/2. Величина 1 – p называется уровнем значимости.
По α, n в зависимости от вида решаемой задачи по таблицам находят одну (для односторонней проверки) или две (для двусторонней проверки) граничные точки, которые наносят на координатную ось. Порядок нахождения граничных точек показан далее.
По результатам выборки вычисляется величина, называемая статистикой. Формула для вычисления статистики зависит от вида решаемой задачи. Значение статистики наносят на координатную ось. В зависимости от взаимного расположения значения статистики и граничных точек возможен один из трех вариантов:
1) принимается H0;
2) отклоняется H0 и без всякой проверки принимается H1;
3) доказательство является неубедительным, нужно больше данных.
Для левосторонней проверки:
Отклонение H0 П |
Принятие H0 p% |
|
граничная точка |
Для правосторонней проверки:
Принятие H0 p % |
Отклонение H0 Принятие H1 (100 – p)% |
|
граничная точка |
Для двусторонней проверки:
Отклонение H0 Принятие H1 [(100 – p)/2]% |
Принятие H0
p |
Отклонение H0 Принятие H1 [(100 – p)/2]% |
граничная точка |
|
граничная точка |
Чем выше доверительная вероятность, тем шире область принятия H0.