
- •1. Які математичні операції можна застосовувати до метричних ознак? Які перетворення можна застосовувати до метричних ознак?
- •2. Наведіть приклади ознак, виміряних в порядковій шкалі.
- •3. Які математичні операції можна застосовувати до порядкових ознак? Які перетворення можна застосовувати до порядкових ознак?
- •Які математичні операції можна застосовувати до номінальних ознак? Які перетворення можна застосовувати до номінальних ознак?
- •Дайте визначення квартилів. Скільки є квартилів? Для ознак в яких шкалах можуть обчислюватися ці показники
- •9. Дайте визначення коефіцієнту варіації. Якою є розмірність цього показника? Які значення може приймати коефіцієнт варіації?
- •Які параметри має нормальний розподіл? Якою є сфера основного застосування цього розподілу?
- •.Які параметри має розподіл 2 ? Якою є сфера основного застосування цього розподілу?
- •Які параметри має розподіл Фішера? Якою є сфера основного застосування цього розподілу?
- •2. В якому випадку говорять про кореляційний зв'язок між двома ознаками? Наведіть приклади.
- •1. Дайте визначення статистичної гіпотези.
- •2. Запишіть приклад нульової та альтернативної до неї статистичної гіпотези.
- •3. Дайте визначення помилки першого роду.
- •4. Дайте визначення помилки другого роду.
- •9. Як оцінюється значущість коефіцієнтів Чупрова та Крамера?
- •6. З якою метою оцінюють значущість різниці середніх? Поясніть на прикладі.
- •Регресія
- •Як інтерпретуються коефіцієнти регресії в рівнянні лінійної регресії?
- •Дайте визначення рівняння лінійної регресії в нормальних (стандартних) координатах. В чому його специфіка по відношенню до звичайного рівняння лінійної регресії?
- •Які Ви знаєте підходи до оцінювання якості рівняння регресії?
- •Як обчислюється і який зміст має коефіцієнт детермінації?
- •Як інтерпретується коефіцієнт множинної кореляції?
- •Дайте визначення лінійного і нелінійного зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Дайте визначення прямого і зворотнього зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Які значення може приймати коефіцієнт Пірсона?
- •Наявність якого зв’язку фіксує коефіцієнт кореляції Пірсона?
- •Як інтерпретуються значення коефіцієнту кореляції Пірсона?
- •Поясніть поняття хибної залежності та хибної незалежності між двома ознаками.
- •Яку інформацію про причинно-наслідковий характер зв’язку дає коефіцієнт кореляції Пірсона?
- •Яке співвідношення між значеннями коефіцієнту кореляції Пірсона та кореляційного відношення?
- •Дайте визначення кластера.
- •Як застосовується кластерний аналіз для побудови типологій об'єктів?
- •Як застосовується кластерний аналіз для групування ознак?
- •Наведіть аксіоми відстані.
- •5. Які ви знаєте визначення відстаней для ознак, виміряних в метричних шкалах?
- •Які ви знаєте визначення відстаней для ознак, виміряних в номінальних шкалах?
- •Як можна оцінити надійність проведеного розбиття на кластери?
- •12. Які особливості структури матриці відстаней?
- •14.Сформулюйте загальну схему алгоритму k-means Cluster (Quick Cluster), реалізованого в пакеті spss. В чому особливості цього алгоритму у порівнянні з ієрархічним кластерним аналізом?
- •Формулы для решения зад ач
Регресія
Дайте визначення лінії регресії.
Лінія регресії це пряма, якою представлено рівняння регресії у геометричному виразі. Вона йде під певним кутом нахилу(b), та відбиває на осі Y відрізок довжиною а. Вона проводиться так, щоб сума квадратів відхилень реальних точок від цієї прямої булу мініамальною. (якщо це метод найм. Квадратів).
Запишіть загальний вигляд рівняння регресії.
- парна лінійна регресія. b – коефіцієнт регресії, а – зсув.
Запишіть загальний вигляд рівняння лінійної регресії.
лінійна регресія. b – коефіцієнт регресії, а – зсув. Це рівняння описує пряму, нахил якої дорівнює коефіцієнту регресії, і відбиває на осі У відрізок довжиною а,
Загальна форма рівняння регресії: ˉy = f (x1, ………., xn)
множинна регресія.
В чому суть застосування методу найменших квадратів при побудові рівняння лінійної регресії ?
-- метод найменших квадратів це сума квадратів відхилен реальних точок від лінії мін, він знаходить Найточніші значення коефіцієнтів емпіричної формули . В результаті забезпечується мінімальна середньоквадратична помилка.
Сенс в тому, щоб сума квадратів відстаней точок до прямої була мінімальною (метод найменших квадратів МНК).
Чим більше даних, тим оцінка має бути кращою. Мета МНК – дізнатися, які фактори впливають позитивно, які негативно, які більше, які менше, чому у змінюється. Маємо зрозуміти, чи має відношення наша модель до емпіричних даних, що ми зібрали, чи відображає вона тенденції цих даних, тобто відповідність моделі.
Як інтерпретуються коефіцієнти регресії в рівнянні лінійної регресії?
Коефіцієнт регресії b показує, на скільки зміниться середнє значення залежної змінної у при зміні фактору х на одну одиницю.
- інтерпретується як сила впливу фактору х на середнє значення залежної змінної у. (або у середнє, якщо регресія множинна), при зміні фактору х на одиницю.
- + означає, що є позитивний вплив х на у, - - що є негативний вплив(зворотній звьязок).
- якщо він не значущий на потрбіному рівні, то це означає що нема впливу данного фактору.
Дайте визначення рівняння лінійної регресії в нормальних (стандартних) координатах. В чому його специфіка по відношенню до звичайного рівняння лінійної регресії?
В нормальних координатах:
- немає зсуву(константи)
- стандартизація збрегіає напрямок впливу фактору (бета дорівнює b), і не впливає на значення R2. (2 значит квадрат).
Які Ви знаєте підходи до оцінювання якості рівняння регресії?
дивимось на значення коефіцієнтів регресії,коеф. Детермінації,
дивимось на сигніфіканс, тобто значущість(повинно бути равно менше 0, 05)
дивимось на значення Ф критерію фішера (теж менше 0, 05)
дивимось на R2. Чим більше, тим якісніше рівняння.
Як обчислюється і який зміст має коефіцієнт детермінації?
Коефіцієнт детермінації це показник(r2) , що описує коефіцієнт кореляції між фактором х та залежною змінною у.
- чим більшим є значення коеф. Детерм., тим краще рівняння пояснює (передбачає) поведінку залежної від х змінної у.
- якщо він не відрізняється від 0, то нема глузду аналізувати регресію по цій ознаці(бо ми отримали, що коеф. Детермінації = 0).
У множинній регресії
- коеф. Детермінації інтерпретують як частку дисперсії у, що пояснюється усіма факторами х1, х2…Чим більше, тим краще.
Яким вимогам повинні задовольняти дані, щоб до них можна було застосовувати регресійний аналіз? Як виконується відбір факторів для побудови рівняння множинної лінійної регресії?
Наявність залежної змінної і припущення про те, що одна або декілька незалежніх змінних (факторів) мають безпосередній вплив на цю залежну змінну.
Залежна і фактори можуть бути виміряни в різних одиницях вимірювання, але залежна змінна повинна бути кількісною, а фактори або кількісними, або дихотомічними.
Фактори повинні корелювати із залежною змінною, але не корелювати між собою(для перевірки кореляцій будують кореляційну матрицю).
Фактори повинні корелювати на значущому рівні(сігніфіканс менше 0.05).
Як інтерпретується коефіцієнт часткової кореляції?
+ позитивний, - - негативний вплив х на у.
Тут у – залежна змінна, а х її фактор
- якщо не значущь на повинному рівні не інтерпретується.