
- •1. Які математичні операції можна застосовувати до метричних ознак? Які перетворення можна застосовувати до метричних ознак?
- •2. Наведіть приклади ознак, виміряних в порядковій шкалі.
- •3. Які математичні операції можна застосовувати до порядкових ознак? Які перетворення можна застосовувати до порядкових ознак?
- •Які математичні операції можна застосовувати до номінальних ознак? Які перетворення можна застосовувати до номінальних ознак?
- •Дайте визначення квартилів. Скільки є квартилів? Для ознак в яких шкалах можуть обчислюватися ці показники
- •9. Дайте визначення коефіцієнту варіації. Якою є розмірність цього показника? Які значення може приймати коефіцієнт варіації?
- •Які параметри має нормальний розподіл? Якою є сфера основного застосування цього розподілу?
- •.Які параметри має розподіл 2 ? Якою є сфера основного застосування цього розподілу?
- •Які параметри має розподіл Фішера? Якою є сфера основного застосування цього розподілу?
- •2. В якому випадку говорять про кореляційний зв'язок між двома ознаками? Наведіть приклади.
- •1. Дайте визначення статистичної гіпотези.
- •2. Запишіть приклад нульової та альтернативної до неї статистичної гіпотези.
- •3. Дайте визначення помилки першого роду.
- •4. Дайте визначення помилки другого роду.
- •9. Як оцінюється значущість коефіцієнтів Чупрова та Крамера?
- •6. З якою метою оцінюють значущість різниці середніх? Поясніть на прикладі.
- •Регресія
- •Як інтерпретуються коефіцієнти регресії в рівнянні лінійної регресії?
- •Дайте визначення рівняння лінійної регресії в нормальних (стандартних) координатах. В чому його специфіка по відношенню до звичайного рівняння лінійної регресії?
- •Які Ви знаєте підходи до оцінювання якості рівняння регресії?
- •Як обчислюється і який зміст має коефіцієнт детермінації?
- •Як інтерпретується коефіцієнт множинної кореляції?
- •Дайте визначення лінійного і нелінійного зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Дайте визначення прямого і зворотнього зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Які значення може приймати коефіцієнт Пірсона?
- •Наявність якого зв’язку фіксує коефіцієнт кореляції Пірсона?
- •Як інтерпретуються значення коефіцієнту кореляції Пірсона?
- •Поясніть поняття хибної залежності та хибної незалежності між двома ознаками.
- •Яку інформацію про причинно-наслідковий характер зв’язку дає коефіцієнт кореляції Пірсона?
- •Яке співвідношення між значеннями коефіцієнту кореляції Пірсона та кореляційного відношення?
- •Дайте визначення кластера.
- •Як застосовується кластерний аналіз для побудови типологій об'єктів?
- •Як застосовується кластерний аналіз для групування ознак?
- •Наведіть аксіоми відстані.
- •5. Які ви знаєте визначення відстаней для ознак, виміряних в метричних шкалах?
- •Які ви знаєте визначення відстаней для ознак, виміряних в номінальних шкалах?
- •Як можна оцінити надійність проведеного розбиття на кластери?
- •12. Які особливості структури матриці відстаней?
- •14.Сформулюйте загальну схему алгоритму k-means Cluster (Quick Cluster), реалізованого в пакеті spss. В чому особливості цього алгоритму у порівнянні з ієрархічним кластерним аналізом?
- •Формулы для решения зад ач
1. Дайте визначення статистичної гіпотези.
Статистична гіпотеза є твердженням про невідомі параметри генеральної сукупності. Перевірка статистичної гіпотези полягає у вирішенні того, приймати чи відхилити гіпотезу на основі відомих значень параметрів вибірки.
2. Запишіть приклад нульової та альтернативної до неї статистичної гіпотези.
Стосовно кожного статистичного результату висувається так звана нульова гіпотеза (про рівність нулю деякої випадкової величини) і альтернативна до неї гіпотеза (про її суттєву відмінність від нуля). У нульовій гіпотезі формулюють результат, який бажано відхилити, а в альтернативній, яка інакше називається експериментальною, — той, що його необхідно підтвердити.Зауваження. Рівність двох величин у загальному випадку може розглядатися як рівність нулю їх різниці.
Приклад. Нульова – всі партії однаково популярні (або думки чоловіків та жінок з приводу чего-то не відрізняються), альтернативна – популярність всіх партій суттєво рівна.
3. Дайте визначення помилки першого роду.
Прийняття або відхилення статистичної гіпотези супроводжується ризиком припуститися помилки. Ймовірність відхилити гіпотезу за умов, якщо насправді вона є правильною, називають ймовірністю помилки першого роду. Таку ймовірність називають ще значущістю. На практиці правило відхилення гіпотези формулюють так, щоб значущість не перевищувала або 0,05, або 0,01.
4. Дайте визначення помилки другого роду.
Помилка другого роду полягає у тому, що буде прийнятою неправильна гіпотеза.
9. Як оцінюється значущість коефіцієнтів Чупрова та Крамера?
Чим більшим є значення фі, тим сильнішим є зв'язок. Коефіцієнт Крамера набуває значень від 0 до 1. Значення 0 інтерпретується як відсутність зв'язку (статистична незалежність). Значення 1 інтерпретується як повний (максимально сильний) зв'язок. Обидва ці коефіцієнти є сенс розглядати та і інтерпретувати лише тоді, коли відповідний хі-квадрат є значущим на потрібному нам рівні.
ПРОСТО ПРО ЧУПРОВА Я НЕ НАШЛА!
А ЦЕ З СТАРОГО ФАЙЛУ:
Для всіх коефіцієнтів побудованих для х2, значущість оцінюється на основі значущості х2(значущий він – значущі інши, навпаки – навпаки).
В квадратних таблицях(де кількість категорій в обох ознаках однакова) – чупров і крамер однакові, дорівнюють між собою
Для витягнутих таблиць Крамер більше ніж чупров (максимум поділений на мінімум)
Ета2 завжди не менше ніж R квадрат.(більше або дорівнює).
Якщо вони дорівнюють – лінійний зв’язок
Якщо ета2 більше R – нелінійна компонента є.
Дайте визначення помилки другого роду.
Похибка відхилити альтернативну гіпотезу Н1, за умови, що вона правильна, називається похибкою другого роду.
5. З якою метою оцінюють значущість різниці відсотків? Поясніть на прикладі.
Потрібно тоді, коли
в соціологічних дослідженнях є дві
генеральні сукупності, з однієї вибрано
вибірку об’ємом n1,
з другої – незалежну вибірку об’ємом
n2.
Виявилося, що частка (відсоток) деякої
ознаки в одній вибірці
,
а в іншій
.
Виникає питання чи не обумовлене
розходження
і
випадковими факторами, тобто чи
розрізняються відсотки цієї ознаки в
генеральних сукупностях. Наприклад, в
дослідженнях частіше виникає ситуація,
коли вибирається одна вибірка, яка потім
розбивається на групи (за статтю,
характером праці) і ставиться завдання
визначити, чи розрізняються виділені
групи за відсотком досліджуваної ознаки.
Порівняння двох відсотків засновано на порівнянні ймовірностей, що лежать в основі двох біноміальних розподілів.
Для прикладу, можливо перевірити на 5%-му рівні значущості, чи відрізняються частки одружених чоловіків і заміжніх жінок і побудувати 95%-ві довірчі інтервали для часток одружених чоловіків, заміжніх жінок і для різниці цих часток.