
- •4.Просторові дані. Часові ряди. Особливості часових рядів. Кореляційне поле.
- •6. Методи вибору найкращої функції регресії
- •9.Моделі часових рядів. Регресійні моделі з одним рівнянням.
- •11) Порівнянність та однорідність даних. Повнота даних та стійкість.
- •12) Сутність методу найменших квадратів
- •14) Поняття кореляція. Кореляційний момент або коваріація. Коефіцієнт кореляції. Вибірковий кореляційний момент. Стандартна похибка.
- •15) Якісна оцінка коефіцієнтів кореляції за шкалою Чеддока. Розподіл Фішера-Іейтса.
- •16, 14(1)) Поняття кореляції. Оцінка значимості коефіцієнта кореляції з використанням t-критерію Стьюдента.
- •17) Матриця коефіцієнтів парної кореляції. Вибірковий коефіцієнт множинної кореляції та коефіцієнт детермінації. Вибірковий частинний коефіцієнт кореляції.
- •18) Проблема мультиколінеарності. Застосування алгоритму Фаррера-Глобера.
- •19) Індекс кореляції. Методика розрахунку кореляційного відношення.
- •20) Побудова економетричної моделі на основі покрокової регресії.
- •21 «Істинне» рівняння регресії. Парна регресія. Систематична та випадкова складові.
- •22.Умови Гаусса-Маркова.
- •23. Властивості оцінок параметрів регресійного рівняння: незміщеність, обґрунтованість, ефективність та інваріантність.
- •24. Оцінки найменших квадратів. Верифікація моделі. Стандартна похибка рівняння. Оцінений коефіцієнт детермінації.
- •26 Множинна регресія. Специфікація багатофакторної моделі. Помилки специфікації множинної регресії.
- •27 Мультиколінеарність. Практичні наслідки мультиколінеарності та методи її усунення.
- •28 Оцінка якості моделі множинної регресії. Перевірка виконання передумов мнк. Перевірка гіпотези про нормальний розподіл залишків регресії
- •29Етапи побудови економетричної моделі
- •31 Нелінійна регресія відносно пояснюючих змінних. Нелінійна регресія по параметрам, що оцінюються. Внутрішньо лінійна та нелінійна функції.
- •31 Нелінійна регресія відносно пояснюючих змінних. Нелінійна регресія по параметрам, що оцінюються. Внутрішньо лінійна та нелінійна функції.
- •32. Особливості параметризації нелінійної регресії. Вибір аналітичної форми дослідження.
- •33. Фіктивні змінні. Ілюстрація використання фіктивної змінної. Множинні сукупності фіктивних змінних.
- •34. Оцінка якості моделі. Дослідження відповідності моделі емпіричним даним. Оцінка точності моделі.
- •35. Поняття гомоскедастичності та гетероскедастичності залишків. Наслідки порушень припущення про гомоскедастичність.
- •36. Методи виявлення гетероскедастичності. Тест Голдфельда-Квандта. Тест рангової кореляції Спірмена.
- •37. Методи виявлення гетероскедастичності. Перевірка гетероскедастичності на основі критерію . Тест Глейсера
- •38. Трансформування початкової моделі з гетероскедастичністю.
- •39. Зважений метод найменших квадратів.
- •40. Оцінювання параметрів регресії за допомогою узагальненого методу найменших квадратів (методу Ейткена).
- •41. Поняття автокореляції. Автокореляція залишків. Лагові затримки.
- •42. Природа автокореляції та її наслідки. Методи усунення автокореляції.
- •43. Тестування наявності автокореляції. Критерій Дарбіна-Уотсона. Критерій фон Неймана.
- •44. Коефіцієнти автокореляції та їх застосування. Автокореляційна функція та корелограма.
- •45. Оцінка параметрів моделі з автокорельованими залишками. Метод Ейткена.
- •46. Оцінка параметрів моделі з автокорельованими залишками. Метод Кочрена-Оркатта.
- •47. Прогноз на основі моделі з автокорельованими залишками.
- •48. Узагальнені економетричні моделі.
- •49. Поняття лагу і лагових змінних.
- •50. Дистрибутивно-лагові моделі. Авторегресійні моделі.
- •51. Моделі розподіленого лагу. Узагальнена модель розподіленого лагу.
- •52. Оцінка параметрів лагових моделей. Метод послідовного збільшення кількості лагів.
- •53. Перетворення Койка (метод геометричної прогресії).
- •54. Модель адаптивних сподівань. Модель часткового коригування.
- •55. Оцінювання параметрів методом Ейткена.
- •56. Динамічний та часовий ряди. Систематичні та випадкові компоненти часового ряду. Стаціонарність часового ряду.
- •57. Фільтрація компонент часового ряду. Ts, ds, тренд-сезонні, нелінійні часові ряди.
- •58. Дослідження автокореляційної функції часового ряду.
- •59. Методи фільтрації сезонної компоненти
- •60. Прогнозування тенденції часового ряду за механічними методами
- •62.Метод декомпозиції часового ряду. Розрахунок сезонної хвилі.
- •65. Ідентифікованість моделі. Необхідна та достатня умови ідентифікованості системи.
- •66. Непрямий метод найменших квадратів.
- •67. Двокроковий та трикроковий методи найменших квадратів.
- •68. Прогноз ендогенних змінних і загальні довірчі інтервали.
14) Поняття кореляція. Кореляційний момент або коваріація. Коефіцієнт кореляції. Вибірковий кореляційний момент. Стандартна похибка.
Кореляція. Вибірковий коефіцієнт кореляції
Між випадковими величинами може існувати лише стохастичний зв'язок, при якому із зміною однієї величини змінюється розподіл іншої. Виявлення стохастичного зв'язку та оцінка його сили – важлива і важка задача математичної статистики. Досить сказати, що це завдання в загальному вигляді не вирішено.
Відомо, що дисперсія суми двох незалежних величин дорівнює сумі дисперсій цих величин. Тому, якщо для двох випадкових величин X і Y виявиться, що
D(X + Y) D(X) + D(Y), (2.1)
то це слугує вірною ознакою наявності залежності між X и Y.
При виконанні вказаної нерівності будемо говорити, що випадкові величини X і Y корельовані і кореляція тим сильніше, чим більш відмінні дисперсії суми від суми дисперсій.
Встановимо величину кореляції між випадковими величинами X і Y. Безпосередньо з властивостей математичного сподівання і дисперсії випливає, що
де
Отже,
сила кореляції визначається величиною
яку з цієї причини називають кореляційним
моментом
або коваріацією.
Отже, коваріація – це статистична
міра взаємодії двох змінних. Очевидно,
необхідною і достатньою умовою кореляції
служить нерівність
Кореляційний момент залежить від одиниць
вимірювання величин X
і Y,
тому на практиці частіше використовується
безрозмірна величина
яка
називається коефіцієнтом кореляції.
Таким
чином, якщо випадкові величини X
і Y
залежні, то коефіцієнт кореляції
відмінний від нуля. На жаль, зворотне
твердження невірно: з рівності
не витікає незалежність випадкових
величин.
Запишемо очевидні рівності:
З визначення коефіцієнта кореляції випливає, що він не змінюється при переході від X і Y до нормованим величин:
для
яких
В цьому випадку з (2.5) отримуємо
(2.7)
звідки
витікає, що
тобто
Якщо
коефіцієнт кореляції відмінний від
нуля, то він своєю величиною характеризує
не тільки наявність, а й силу зв'язку
між змінними. Чим більше ||,
тим сильніше зв'язок (кореляція).
Максимальна кореляція значенням =
1. Як неважко помітити, в цьому випадку
або
,
отже,
або
Повертаючись до величин X і Y, відмічаємо,
що при
=
1 між ними існує строгий функціональний
(причому, лінійний) зв'язок.
Зі сказаного випливає, що при 0 < || <1 між Y і X може бути як стохастичний зв'язок, так і функціональний (нелінійний) без сліду випадковості. У цьому полягає серйозний недолік коефіцієнта кореляції. Ми можемо лише вважати, що є показником того, наскільки зв'язок між випадковими величинами Y і X близький до строгої лінійної залежності.
Незміщеними
оцінками кореляційного моменту
і дисперсій
і
є вибірковий
кореляційний момент
(вибіркова коваріація)
і вибіркові
дисперсії
і
.
Тоді якщо відомі
–
фактичні значення змінних X
і Y,
то вибіркова коваріація між ними
розраховується наступним чином
,)
де
–
середні арифметичні відповідних величин.
Видно, що у виразі для присутній один зв'язок (добуток середніх), тому для нього, як і для вибіркових дисперсій, число ступенів свободи дорівнює n-1.
Той факт, що для отримання незміщеної оцінки s2 в знаменнику вибіркової дисперсії довелося n замінити на n-1, безпосередньо пов'язаний з тим, що величина відносно якої беруться відхилення, сама залежить від елементів вибірки. Якщо б у формулі вибіркової дисперсії були дві такі величини, то n потрібно було б замінити на n-2 і т.д.
Кожна величина, яка залежить від елементів вибірки і є у формулі вибіркової дисперсії, називається зв'язком. Виявляється, що знаменник вибіркової дисперсії завжди дорівнює різниці між обсягом вибірки n і числом зв'язків, накладених на цю вибірку. Число r = n-l називається числом ступенів свободи.
Вибірковий коефіцієнт кореляції (коефіцієнт кореляції Пірсона) розраховується за формулою
.
При цьому оцінка дисперсії характеризує ступінь розкиду значень навколо їх середнього або варіабельність та визначається за формулою
В загальному випадку для отримання незміщеної оцінки дисперсії суму квадратів необхідно поділити на число ступенів свободи. Так як вибірка вже використовувалася один раз для визначення середнього Х, то число накладених зв’язків в даному випадку дорівнює одиниці, а число ступенів свободи n-1.
Однак, більш природно вимірювати ступінь розкиду значень змінних в тих же одиницях, в яких вимірюється і сама змінна. Цю задачу вирішує показник, що називається середньоквадратичним відхиленням (стандартним відхиленням) або стандартною похибкою і визначається співвідношенням
.