- •102. Парная коррелация.
- •103. Частная корреляция.
- •104.Неметрическая корреляция.
- •107. Множественная регрессия.
- •Пошаговая регрессия (stepwise regression)
- •114.Основы дискриминатного анализа
- •115. Модель дискриминатного анализа.
- •Нормированные коэффициенты дискриминантных функций
- •116. Выполнение дискриминантного анализа.
- •Определение коэффициентов дискриминантной функции
- •117.Множественный дискриминантный анализ.
- •120. Выполнение факторного анализа
107. Множественная регрессия.
Множественная регрессия. Статистический метод, с помощью которого можно вывести математическую зависимость между двумя или больше независимыми переменными и зависимой переменной, выраженной с помощью интервальной или относительной шкалы.
Множ. регрессия позволяет ответить на сл. вопросы:
- Можно ли вар V продаж объяснить с т. зрения расходов на рекламу, цен и уровня каналов распределения?
- Может ли вариация доли рынка зависеть от количества торгового персонала, расходов на рекл и бюдж на продвижение товара?
- Определяется ли восприятие потребителей качества товара их восприятием цены, имиджа торговой марки и характеристик товара?
_
Модель множств регрессии:y=a+b1X1+b2X2+b3X3+…+bkXk.
а представляет собой отрезок, отсекаемый на оси OY.
Статистики связанные с множественной регрессией:
Скорректированный коэффициент множественной детерминации R^2. Коэффициент множественной детерминации R^2 корректируют с учетом числа независимых переменных и размера выборки, чтобы снизить влияние зависимости коэффициента детерминации от количества переменных
Коэффициент множественной детерминации R^2. Тесноту связи между переменными при множественной регрессии измеряют, возводя в квадрат коэффициент множественнойкорреляции.
F-критерий. Используется для проверки нулевой гипотезы о том, что коэффициент множественной детерминации в совокупности R^2 =0
Частный F-критерий. Значимость частного коэффициента регрессии B переменной Хi, можно проверить, используя приростную F-статистику
Частный коэффициент регрессии. Частный коэффициент регрессии А, обозначает изменение в предсказанном значении Y при изменении X, на единицу, когда другие независ переменные от Х2до Xk остаются неизмен.
108.Выполнение можеств регрессионного анализа.
Рассм случай с 2 незав. перем:
Y(с крышечкой)=a+b1x1+b2x2.
β – кэфф явл. частным коэфф регрессии, получ после того, как перед оценкой ур-я регресс. все переменные нормированы.
Теснота связи: SSy=SSрегрес.+SSостат.
SSy= Σ(yi-y(среднее))^2; SSрегр= Σ(yi(c крышечкой)-y(среднее))^2
SSостат= Σ(yi-yi(с крышечкой).
109.ПОШАГОВАЯ РЕГРЕССИЯ
Пошаговая регрессия (stepwise regression)
Регрессионная процедура, в которой предикторы по очереди вводят или выводят из уравнения регрессии.
Сущ неск. подходов пошаговой регресс
Прямое включение . Вначале уравнение регрессии не содержит предикторов. Они вводятся по одному, если они удовлетворяют определенному F-крит. В основе порядка введения включаемых переменных лежит вклад переменной в объясняемую вариацию.
Обр пошаговая регрессия. Вначале все предикторы входят в уравнение регрессии. Затем по очереди выводятся из уравнения, исходя из их соответствияF- критерию.
Пошаговый подход. На каждой стадии прямое включение осуществляют одновременно с выводом предикторов, которые больше не удовлетворяют конкретному критерию.
110.МУЛЬТКОЛЛИНЕАРНОСТЬ И ОТНОСИТЕЛЬНАЯ ВАЖНОСТЬ ПРЕДИКТОРОВ.
Мул ьтиколл и неарностьСостояние очень высокой степени корреляции между независимыми переменными.
Мул ьтиколл и неарность может привести к нескольким проблемам:
1. Частные коэффициенты регр нельзя точно определить. Значения стандартных ошибок скорее всего очень высокие.
2. Величины и знаки частных коэффициентов регрессии могут изменяться от выборки к выборке.
3. Трудно оценить относительную важность независимых переменных при объяснении вариации зависимой переменной,
4. Предикторы могут быть некорректно введены или исключены из уравнения регрессии в ступенчатой регрессии.
Следует уделять внимание относительной важности независ. перменным:
1.Статистическая значимость. Если частный коэффициент регрессии переменной не является значимым, что определяется приростным F-критерием, то эту переменную не считают важной
2. Квадрат линейного коэффициента корреляции. Этот показатель r^2 представляет долю вариации зависимой переменной, которую можно объяснить независимой переменной в парной зависимости.
3. Квадрат частного коэффициента корреляции. Этот показатель R^2 yx1 представляет собой коэффициент детерминации между зависимой и независимой переменными, при исключении эффектов от влияния других независимых переменных.
4. Квадрат частичного коэффициента корреляции. Этот коэффициент представляет увеличение r^2, когда переменную вводят в уравнение регрессии, которое содержит другие независимые переменные.
5. Показатели, основанные на нормированных коэффициентах или взвешенных "бета" коэффициентах. Эти наиболее часто используемые показатели представляют собой абсолютные значения взвешенных "бета"-коэффициентов β или значения квадратов коэф-
фициентов P2j. Поскольку это частные коэффициенты, то взвешенные "бета"
коэффициенты учитывают эффект других независимых переменных.
111 ПЕРЕКРЕСТНАЯ ПРОВЕРКА.
Перекрестная проверка. Проверка достоверности модели, с помощью которой изучают, применима ли регрессионная модель для анализа сопоставимых данных, не использовавшихся при построении исходной модели.
Процедура перекрестн. проверки:
1. Марк. рассчитывают регрессионную модель, используя полный набор данных.
2. Имеющиеся данные делят на две части: расчетную выборку и контрольную выборку.
3. Регрессионную модель рассчитывают, используя только данные из расчетной выборки. Эту модель сравнивают с моделью, рассчитанную по данным полной выборки, чтобы определить их соответствие с точки зрения знаков и величин частных коэффициентов регрессии.
4. Рассчитанную модель применяют к данным из контрольной выборки чтобы определить значения зависимой переменной У, для наблюдений в контрольной выборке.
5. Наблюдаемые значения У и расчетные теоретические значения У, в контрольной выборке сопоставляют, чтобы определить линейный коэффициент детерминации R^2. Его сравнивают с коэффициентом R^2 для полной выборки и с R^2 — для расчетной выборки, чтобы оценитьстепень сжатия.
112. РЕГРЕССИЯ С ИСП. ФИКТ ПЕРЕМЕННЫХ.
Перекрестная проверка представляет собой общую процедуру, которую можно применять
для некоторых специальных приложений регрессии, таких как регрессия с использованиемфиктивных переменных. В качестве предикторов можно использовать номинальные переменные, закодировав их как фиктивные. Регрессия с фиктивными переменными описывается таким уравнением:
Y. = a + b1D1 + b2D2 + b3D3.
?????????????????????????????????????????????????????????????????
113. Дисперсионный и ковариационный анализ с исп. регрессии.
Регрессия с фиктивными переменными служит основой для понимания дисперсионного и ковариационного анализа. Покажем, что регрессия с фиктивными переменными равнозначна однофакторному дисперсионному анализу. В регрессии с фиктивными переменными теоретически определенное значение У для каждого уровня категориальной переменной представляет собой среднее значение Y для каждого уровня. Чтобы проиллюстрировать использование фиктивной переменной, обозначающей использование товара, приведем ниже вычисленные У и средние значения для каждого уровня.
Принимая во внимание данные равенства, легко проследить дальнейшую связь между регрессией с фиктивными переменными и однофакторным дисперсионным анализом ANOVA
Таким образом, мы видим, что регрессионный анализ, в котором единственная независимая переменная с с-уровнями (категориями) может быть записана с — 1 фиктивными переменными, эквивалентен однофакторному регрессионному анализу. Аналогично можно показать, как выполнить многофакторные дисперсионный и ковариационный анализ, используя регрессию с фиктивными переменными.