- •Лабораторные работы №№ 6 – 8 Анализ корреляционных связей. Цель работы.
- •Двойная группировка данных.
- •Корреляционное поле
- •Расчет параметров линейной модели.
- •Оценка тесноты и значимости корреляционной связи.
- •Доверительные интервалм на цетры групп.
- •Оценка тесноты и значимости линейной модели.
- •Проверка адекватности (линейности) модели.
- •Выбор нелинейной формы связи
- •Доверительные интервалы на расчетные значения.
- •Коэффициенты контингенции.
- •Контрольні питання
- •Роз’яснити зміст “діагональної регресії”, відповісти, чи є діагональна регресія регресією взагалі (згідно з визначенням цього поняття), у яких випадках доцільно використовувати цю модель.
- •Викласти ідею принципу Лежандра (мнк), роз’яснити зміст системи нормальних рівнянь, скласти систему нормальних рівнянь для лінійної і квадратичної моделей однієї змінної.
- •Перелічити основні передумови регресійного аналізу. Сформулювати ідею принципу максимальної правдоподібності і показати, що по цьому принципу найкращими оцінками параметрів моделі є мнк–оцінки.
- •Викласти ідею розрахунку дисперсій коефіцієнтів регресії і дисперсій розрахункових значень. Описати графічний спосіб побудови 95%-вої довірчої смуги на лінію регресії.
Контрольні питання
1. Дайте визначення функціональної, статистичної і кореляційної залежностей. Продемонструйте розбіжності між спряженими кореляційними моделями. Наведіть приклад статистичної, але не кореляційної залежності.
2. Роз'ясніть зміст "діагональної регресії", скажіть, чи є діагональна регресія регресією взагалі (згідно із визначенням цього поняття), у яких випадках доцільно використовувати цю модель.
3. Сформулюйте ідею принципу Лежандра (МНК), роз'ясніть зміст системи нормальних рівнянь, складіть систему нормальних рівнянь для лінійної і квадратичної моделей однієї змінної.
4. Сформулююйте основні передумови дисперсійного аналізу. Доведіть, що середні по групах є найкращими МНК-оцінками центрів кожної групи. Розкладіть загальну суму квадратів на міжгрупову і внутрішньогрупову складові.
5. Опишіть методику порівняння двох вибірок за критерієм Стьюдента. Сформулюйте основні припущення (гіпотези) цього методу. Покажіть, що цей аналіз є частковим випадком дисперсійного аналізу, коли кількість порівнюваних груп дорівнює двом.
6. Покажіть, як будується емпірична лінія регресії, як оцінюється тіснота кореляційного зв'язку. Поясніть, що таке "індекс детермінації" і "кореляційне відношення", чим вони відрізняються від "коефіцієнта детермінації" і "коефіцієнта кореляції" відповідно.
7. Викладіть послідовність розрахунків для оцінки значущості кореляційного зв'язку. Опишіть таблицю дисперсійного аналізу, роз'ясніть зміст її окремих граф (стовпців) — сум квадратів, чисел ступенів свободи, середніх квадратів. Поясніть, який зміст має "дисперсійне відношення Фішера", що таке "рівень значущості" і як ним користуватися.
8. Викладіть послідовність розрахунків для оцінки значущості регресійної моделі. Опишіть таблицю дисперсійного аналізу, роз'ясніть зміст її окремих граф. Виразіть для цієї проблеми дисперсійне відношення через коефіцієнт детермінації.
9. Опишіть методику оцінки значущості коефіцієнта регресії і коефіцієнта парної кореляції за критерієм Стьюдента. Доведіть, що ця методика є частковим випадком дисперсійного аналізу для оцінки значущості лінійної одновимірної моделі.
10. Викладіть послідовність розрахунків для оцінки адекватності моделі. Опишіть таблицю дисперсійного аналізу, роз'ясніть зміст її окремих граф. Покажіть, у чому різниця між оцінкою дисперсії залишку моделі і дисперсією випадкової похибки.
11. Виведіть формули для розрахунку параметрів парної лінійної регресії. Дайте визначення коефіцієнта парної кореляції, охарактеризуйте його властивості. Поясніть, що таке "коефіцієнт детермінації", чим він відрізняється від "індексу детермінації".
12. Перелічіть основні передумови регресійного аналізу. Сформулюйте ідею принципу максимальної правдоподібності і покажіть, що за цим принципом найкращими оцінками параметрів моделі є МНК-оцінки.
13. Сформулюйте ідею розрахунку дисперсій коефіцієнтів регресії і дисперсій розрахункових значень. Опишіть графічний спосіб побудови 95%-ї довірчої смуги на лінію регресії.
14. Поясніть спосіб вибору форми зв'язку. Продемонструйте можливості узагальненої лінійної моделі, нелінійної щодо аргументів, але лінійної щодо параметрів. Розгляньте стандартні перетворення змінних (логарифмування і перехід до зворотних величин).
15. Роз'ясніть ідею методу зважених найменших квадратів. Покажіть, що функціональні перетворення результативної ознаки призводять до порушення рівноточності (гомоскедастичності) спостережень, і запропонуйте вагову функцію для усунення наслідків порушення зазначеної передумови регресійного аналізу.
Ответы
Дати визначення функціональної, статистичної і кореляційної залежностей. Продемонструвати розходження між спряженими кореляційними моделями. Привести приклад статистичної, але не кореляційної залежності.
По определению функциональной зависимости, каждому значению аргумента (набору значений аргументов) соответствует единственное значение результативного признака. В стохастических (вероятностных) зависимостях каждому значению аргумента соответствует свой ряд распределения результативного признака. Частным случаем стохастической зависимости является корреляционная зависимость, когда следят за изменением только одной характеристики распределения результативного признака – центром группировки Y при каждом значении X (т.е. за изменением условного математического ожидания M(y x) при изменении аргумента x). График корреляционной зависимости называется также линией регрессии, а ее уравнение – уравнением регрессии. Для корреляционных как и для функциональных зависимостей имеет место однозначное соответствие между значениями аргумента и откликом (средними значениями результативного признака ). Однако, между этими видами зависимостей остается принципиальное различие – корреляционные зависимости необратимы относительно замены направления причинно-следственных связей. В наиболее распространенном случае совместного нормального распределения двух случайных величин (X,Y) облако рассеяния точек (X,Y) имеет форму вытянутого эллипса. Линия регрессии представляет собой диаметр этого эллипса, сопряженный семейству вертикальных хорд (середины вертикальных хорд). Если же в качестве результативного признака выбрана другая переменная X (y - причина, x - следствие), то линия регрессии представляет собой диаметр эллипса, сопряженный семейству горизонтальных хорд (середины горизонтальных хорд ). Это совсем разные диаметры (разные корреляционные зависимости не только по аналитической форме записи, но и по существу, так называемые сопряженные регрессии). Существуют также стохастические, но некорреляционные зависимости, когда при изменении аргумента Х изменяется не центр группировки Y, а другие характеристики распределения отклика, например, изменчивость (дисперсия).