Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1-48.docx
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
245.85 Кб
Скачать

16. Понятие о регрессионном анализе. Общий алгоритм проведения регрессионного анализа. Выдвижение гипотезы о характере зависимости между признаками.

Регрессионный (линейный) анализ — статистический метод исследования влияния одной или нескольких независимых переменных на зависимую переменную.

Регрессия – зависимость среднего значения какой-либо случайной величины от некоторой другой величины или нескольких величин (в последнем случае — имеем множественную Р.).

Теоретической линией регрессии называется та линия, вокруг которой группируются точки корреляционного поля и которая указывает основные направления, основную тенденцию связи.

Алгоритм проведения регрессионного анализа:

  1. выявление связи между признаками, оценка степени тесноты связи.

  2. определение объекта

  3. отбор факторов

  4. сбор и подготовка информации

  5. выбор модели связи

  6. исчисление показателей тесноты корреляционной связи

  7. оценка адекватности регрессионной модели

17. Построение уравнения регрессии при линейной парной зависимости между признаками. Система нормальных уравнений. Оценка параметров уравнения регрессии. Ошибки аппроксимации. Критерий Фишера. Уровни значимости уравнения регрессии.

Система нормальных уравнений. (ср – среднее)

Линейная зависимость:

система: a*n+b∑Xi=∑Yi (1)

a∑Xi+b∑X²i=∑Yi*Xi (2)

система: a+b*ср.X=ср.Н

a*ср.X+b*ср.X²=ср.(y*x)

a=ср.Y – b*ср.Х

линейные коэф-ты корреляции

ryx=(x*cp.y – cp.x*cp.y)/(сигма х* сигма у)

(ср.у – b*ср.х)*ср.х+b*ср.х²=ср.(у*х) => ср.х*ср.у – b*(ср.х)²+b*ср.х²=ср.(у*х)

b*(ср.х² - (ср.х)²)=ср.(х*у) – ср.у*ср.х => b=(ср.(у*х) – ср.у.*ср.х)/(ср.х²-(ср.х)²)

b=((ср.(ух) – ср.у*ср.х)*сигма у)/((ср.х² - (ср.х)²)*сигма у)=r*(сигма у/сигма х)

Ко=b*(Хср./Yср) %

Для оценки целесообразности применения регресс.модели для прогноза изучаемой зависимости испол-ся показатель – индекс корреляции, отражающий степень тесноты связи между вариацией факторного и регул-ого признаков.

Уе=√(1-((∑(Yi – Y(cсверху галочка на у))²)/(∑(Yi-Yср)²))

Y сверху галочка над ним - выравнивание 0 меньше или равно i*Ye меньше или равно 2 (вычисл.по лин.регресс)

Проверка параметров регр.модели и ур.регр. в целом на адекватность данным (подтв-ие гипотезы о форме зависимости).

Наименование параметра

Среднее. Квадр.ошибка

Уравнение регрессии в целом (оценка полезности ур.регрессии)

Se=√((∑(Yi – Yiтеор)²)/(n-m)) <сигма у

m-число параметров ур.регрессии

Параметр в ур.регрессии

Sb=Se/(√∑Хi² - n*(Xcp)²)

Параметр а

Sa=Se/√n

Se-общ.ошиб.

Проверка адекватности линейн.регр-ой модели факт-ому распре-ию при малой выборке (n<=30) осущ-ся по табулированным значениям F-распределения (критерий Фишера).

Fэ=((сигма ух)²/ ((сигма у²)-ух))-(n-m)/(m-1)

((сигма у²)-ух) остаточная дисперсия

m-число параметров модели

n-число ед.наблюдения.

F1<Fэ, где F1 определяется по вероятности 0,01 или 0,05 и числом степени свободы (m-1) (столбец табл.распределения) и (n-m) (строка таблицы распределеня), уравнение регрессии признается значимым.

С вероятностью 0,95 признается значимым (при 0,05).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]