
- •О с н о в ы н а у ч н ы х и с л е д о в а н и й
- •1. Определение проблемы;
- •1.2 Анализ сомнительных вариант
- •2.1 Определение необходимого объема выборки
- •3.1 Применение коэффициентов асимметрии и эксцесса для проверки нормальности распределения
- •Практическая работа 4
- •4. Корреляционный анализ
- •4.1. Параметрические показатели связи
- •4.2. Установление наличия связи между выборками.
- •Практическая работа 5
- •5. Регрессионный анализ
- •Первый этап - определение параметров линейной регрессии
- •5.2. Оценка достоверности показателей регрессии
- •Практическая работа 6
- •6. Общие правила подготовки и написания отчетов по научно-исследовательской работе
- •6.1. Порядок составления отчетов
- •6.2. Титульный лист
- •Практическая работа 7
- •7. Составление библиографической записи документа
- •7.1. Одноуровневое библиографическое описание.
- •7.2. Аналитическое и библиографическое описание
- •Заключение
- •Период 2000 – 2010гг
- •Виноградова л.И. Основы научных исследований
- •660017, Красноярск, ул. Ленина, 117
Практическая работа 5
5. Регрессионный анализ
Построение прогностического правила
Зависимость между переменными величинами Х и Y может быть описана разными способами. Если Y зависимая переменная величина или функция, а Х – независимая переменная величина или аргумент, то соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д. Изменение функции в зависимости от изменения одного или нескольких аргументов называется регрессией. Весь арсенал средств, применяемых для описания корреляционных связей, составляет содержание регрессионного анализа. Чаще связь между переменными выглядит в виде прямой линии. Линейная зависимость между переменными Х и Y описывается уравнением общего вида Yx = a + bx1 + cx2 + dx3 +…, где a, b, c, d,…- коэффициенты уравнения, на практике учитывают не все возможные а лишь некоторые аргументы, в простейшем случае – всего один:
Yx = a + bx (5.1)
В этом уравнении линейной регрессии а – свободный член, а параметр b определяет наклон линии регрессии по отношению к осям координат или называется коэффициентом регрессии [5].
Первый этап - определение параметров линейной регрессии
Для определения параметров уравнения регрессии составляется система уравнений, называемых нормальными:
(5.2)
Совместное решение этих уравнений относительно параметров a и b приводит к следующим результатам:
(5.3)
(5.4)
Определим a и b на конкретном примере по формулам 5.3,5.4, если известно, что x=166.8, y=179.2, xy=2987.5, x2=2790.4 (эти расчеты выполнены в предыдущей теме – корреляционный анализ):
Следовательно, уравнение регрессии или прогностическое правило имеет вид:
5.2. Оценка достоверности показателей регрессии
2
этап.Выборочные
показатели регрессии являются оценками
соответствующих генеральных параметров
и, как величины случайные, сопровождаются
статистическими ошибками. Ошибку
выборочного показателя регрессии Y
и X
определяют по формуле
(5.5)
Достоверность выборочных коэффициентов регрессии оценивают с помощью критерия Стьюдента (см. приложение 8) Нулевую гипотезу отвергают на принятом уровне значимости (а) с числом степеней свободы k = n - 2, если tф tst., следовательно, подтверждена достоверность показателя регрессии
Рассчитаем
ошибку коэффициента регрессии на примере
по формуле 5.5:
Оценим нулевую гипотезу по критерию Стьюдента. Критерий Стьюдента фактический tф = -0,31/ 0.11 = 2.82, далее определяем tк = 2,26 по таблице приложения 8 (по уровню значимости - а = 5% и по числу степеней свободы k = 9), нулевая гипотеза отвергается, таким образом подтверждена достоверность показателя регрессии.
Третий этап - заключается в расчете ошибки уравнения регрессии. Так как эмпирические уравнения регрессии сопровождаются ошибками, рассчитаем ошибку по следующей формуле
(5.6)
Четвертый этап заключается в определении доверительного интервала.
Иногда практический интерес может представлять построение доверительного интервала для отдельных наблюдений, например, если требуется очертить зону, включающую в себя определенный процент всех эмпирических наблюдений располагающихся возле линии регрессии. В этом случае доверительный интервал будет иметь границы
Задание. Для двух выборок Х и Y построить прогностическое правило т. е. рассчитать уравнение регрессии Yx = a + bx, с учетом вышеизложенных формул для коэффициентов уравнения регрессии a и b. оценить достоверность коэффициентов уравнения, рассчитать доверительную зону и ошибку уравнения регрессии