
- •2. Дайте определение теоретическому коэффициенту корреляции. Что он показывает? в каком диапазоне меняется?
- •3. Почему на практике исследователь не может вычислить сам теоретический коэффициент корреляции?
- •24. В каком случае применение евклидова расстояния не имеет под собой теоретического основания (хотя может давать разумные результаты)?
- •25. Назовите известные Вам алгоритмы агломерации.
- •26. Даны 4 трехмерных наблюдения. Реализуйте их кластеризацию на основе метода ближнего соседа (дальнего соседа, средней связи) и расстояния Евклида (Манхеттен, Чебышев). Постройте дендрограмму
- •27. Дана дендрограмма. Укажите получившиеся кластеры.
- •29. Объясните, почему при кластеризации необходимо приводить все показатели к единой шкале измерения?
- •34. Кто и почему впервые назвал регрессию регрессией?
- •35. В чем суть метода наименьших квадратов?
- •36. Формализуйте идею метода наименьших квадратов в ситуации парной линейной регрессии (в случае центрированных иксов).
- •37. Выведите мнк-оценки коэффициентов парной линейной регрессии (в случае центрированных иксов).
- •38. Как получить мнк-оценки коэффициентов парной линейной регрессии в обычном случае центрированных иксов?
- •39. Покажите связь между коэффициентом корреляции к.Пирсона и коэффициентом β1 парной линейной регрессии. (См рисунок в контакте)
- •Вопрос 40. Сформулируйте 4 условия Гаусса – Маркова.
- •Вопрос 41. Сформулируйте теорему Гаусса – Маркова
- •1. Несмещенность
- •2. Эффективность
- •47.Что такое автокорреляция остатков? Когда она может возникать в регрессионной модели?
- •48. К каким последствиям для свойств мнк-оценок ведет нарушение каждого из условий Гаусса – Маркова?
- •51.Укажите распределение (и его параметры) мнк-оценок коэффициентов регрессии при выполнении условий Гаусса – Маркова и условия нормальности. (смотри оисунок в контакте)
- •52. Дано значение мнк-оценок коэффициентов парной регрессии. Известно число наблю-дений. Проверьте, значимы ли коэффициенты регрессии.
- •53. Дана таблица результатов регрессионного анализа из некоторой статьи англоязычного политологического журнала. Укажите статистически значимые коэффициенты регрессии.
- •54. Даны несколько пар наблюдений над случайными величинами X и y. Постройте уравне-ние регрессии y на X и проверьте значимость коэффициентов.
- •55. Что такое коэффициент детерминации? Что он показывает?
- •56. Даны значения rss и ess. Найти r(квадрат)
- •57. Дано значение коэффициента корреляции между X и y. Найти r(квадрат)
- •60. Даны значения rss и ess, число наблюдений и число предикторов в регрессии. Проверить гипотезу о качестве модели на основе статистики Фишера.
- •61. Дано значение r2, число наблюдений и число предикторов в регрессии. Проверить гипотезу о качестве модели на основе статистики Фишера.
- •63. Дана таблица дисперсионного анализа. Заполнить пропуски в таблице.
- •64. Дана таблица выдачи регрессионного анализа. Запишите полученное уравнение регрес-сии
- •67. Какова природа проблемы мультиколлинеарности в задачах множественной регрессии?
- •68.К чему ведет мультиколлинеарность?
- •73. Каковы методы выявления автокорреляции в задаче регрессионного анализа?
- •74. В чем состоит проблема эндогенности в задаче регрессии? Каковы последствия эндогенности для мнк-регрессии?
- •75.В чем состоит проблема гетероскедастичности? Из-за чего она возникает и каковы ее по-следствия для мнк-оценок коэффициентов регрессии?
- •76.Опишите не менее 2 методов выявления гетероскедастичности остатков в задаче множе-ственной регрессии.
- •77. Опишите известные Вам методы борьбы с гетероскедастичностью остатков в задаче множественной регрессии.
- •78. Назовите задачи, которые решает метод главных компонент.
- •79. Приведите примеры использования мгк в политологических задачах.
- •90. Назовите оптимальные свойства главных компонент.
- •91. Объясните смысл характеристического уравнения для ковариационной матрицы:
- •94. Чему равен коэффициент корреляции между главными компонентами?
60. Даны значения rss и ess, число наблюдений и число предикторов в регрессии. Проверить гипотезу о качестве модели на основе статистики Фишера.
61. Дано значение r2, число наблюдений и число предикторов в регрессии. Проверить гипотезу о качестве модели на основе статистики Фишера.
Ho : R2= 0 vs H1 : R2 не равно 0
для проверки значисмости R2 (выборочный) используется специальная статистика Фишера
f(R2 ) = F (статистика Фишера)
(**) F= ((ESS/ТSS) *1/k) / ((RSS/TSS) * 1/N-k) = ((1/k-1) * R2)) /(( 1/N-k) * (1- R2 ) )
k- число оцениваемых параметров модели (предикаторов)
N – число наблюдений
При верности Ho: F ~ F ( k-1; N-k)
Распределение Фишера (связано с нормальным)
F (k,m) = (1/k * χ² (k)) / (1/m * χ² (m))
χ² (k) = ∑z² , где Z ~ N (0,1) z – это стандартная нормальная величина
Считаем F по формуле (**), если попало в критическую зону, то R2 отличен от нуля
R2 =1, если наша регрессионная прямая прошла через все точки, хорошая модель
чем больше R2 , тем лучше модель
62. Дан t-статистика, проверить гипотезу с помощью Фишера.
Гипотеза:
Н0: B0=0
H1: B1не равна 0.
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством
Если tтабл < tфакт, то Hо отклоняется, т.е. а, b и rxy не случайно отличаются от нуля н сформировались под влиянием систематически действующего фактора x, Если tтабл > tфакт то гипотеза Нo не отклоняется
63. Дана таблица дисперсионного анализа. Заполнить пропуски в таблице.
Таблица состоит из значений TSS, RSS, ESS.
TSS (Total) = RSS (остатки) + ESS (модель регрессии)
TSS = ∑(yi – yсреднее)2
ESS = ∑(yкрышка – yсреднее)2
RSS = ∑(yi – yкрышка)2
reg dem_2000 cli gini_ye
64. Дана таблица выдачи регрессионного анализа. Запишите полученное уравнение регрес-сии
Source | SS df MS Number of obs = 25
-------------+------------------------------ F( 2, 22) = 13.86
Model | 6.88491132 2 3.44245566 Prob > F = 0.0001
Residual | 5.46595999 22 .248452727 R-squared = 0.5574
-------------+------------------------------ Adj R-squared = 0.5172
Total | 12.3508713 24 .514619638 Root MSE = .49845
------------------------------------------------------------------------------
dem_2000 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
cli | .3920828 .0807622 4.85 0.000 .2245922 .5595733
gini_ye | .0022019 .0182327 0.12 0.905 -.0356105 .0400143
_cons | -.7912347 .7457838 -1.06 0.300 -2.337896 .7554263
------------------------------------------------------------------------------
Уравнение регрессии:
dem_2000 = - 0,79 + 0,39*cli + 0,002*gini_ye + εi
65,66