
- •1. Які математичні операції можна застосовувати до метричних ознак? Які перетворення можна застосовувати до метричних ознак?
- •2. Наведіть приклади ознак, виміряних в порядковій шкалі.
- •3. Які математичні операції можна застосовувати до порядкових ознак? Які перетворення можна застосовувати до порядкових ознак?
- •Які математичні операції можна застосовувати до номінальних ознак? Які перетворення можна застосовувати до номінальних ознак?
- •Дайте визначення квартилів. Скільки є квартилів? Для ознак в яких шкалах можуть обчислюватися ці показники
- •9. Дайте визначення коефіцієнту варіації. Якою є розмірність цього показника? Які значення може приймати коефіцієнт варіації?
- •Які параметри має нормальний розподіл? Якою є сфера основного застосування цього розподілу?
- •.Які параметри має розподіл 2 ? Якою є сфера основного застосування цього розподілу?
- •Які параметри має розподіл Фішера? Якою є сфера основного застосування цього розподілу?
- •2. В якому випадку говорять про кореляційний зв'язок між двома ознаками? Наведіть приклади.
- •1. Дайте визначення статистичної гіпотези.
- •2. Запишіть приклад нульової та альтернативної до неї статистичної гіпотези.
- •3. Дайте визначення помилки першого роду.
- •4. Дайте визначення помилки другого роду.
- •9. Як оцінюється значущість коефіцієнтів Чупрова та Крамера?
- •6. З якою метою оцінюють значущість різниці середніх? Поясніть на прикладі.
- •Регресія
- •Як інтерпретуються коефіцієнти регресії в рівнянні лінійної регресії?
- •Дайте визначення рівняння лінійної регресії в нормальних (стандартних) координатах. В чому його специфіка по відношенню до звичайного рівняння лінійної регресії?
- •Які Ви знаєте підходи до оцінювання якості рівняння регресії?
- •Як обчислюється і який зміст має коефіцієнт детермінації?
- •Як інтерпретується коефіцієнт множинної кореляції?
- •Дайте визначення лінійного і нелінійного зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Дайте визначення прямого і зворотнього зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Які значення може приймати коефіцієнт Пірсона?
- •Наявність якого зв’язку фіксує коефіцієнт кореляції Пірсона?
- •Як інтерпретуються значення коефіцієнту кореляції Пірсона?
- •Поясніть поняття хибної залежності та хибної незалежності між двома ознаками.
- •Яку інформацію про причинно-наслідковий характер зв’язку дає коефіцієнт кореляції Пірсона?
- •Яке співвідношення між значеннями коефіцієнту кореляції Пірсона та кореляційного відношення?
- •Дайте визначення кластера.
- •Як застосовується кластерний аналіз для побудови типологій об'єктів?
- •Як застосовується кластерний аналіз для групування ознак?
- •Наведіть аксіоми відстані.
- •5. Які ви знаєте визначення відстаней для ознак, виміряних в метричних шкалах?
- •Які ви знаєте визначення відстаней для ознак, виміряних в номінальних шкалах?
- •Як можна оцінити надійність проведеного розбиття на кластери?
- •12. Які особливості структури матриці відстаней?
- •14.Сформулюйте загальну схему алгоритму k-means Cluster (Quick Cluster), реалізованого в пакеті spss. В чому особливості цього алгоритму у порівнянні з ієрархічним кластерним аналізом?
- •Формулы для решения зад ач
Ознаки, шкали, квартилі
1. Які математичні операції можна застосовувати до метричних ознак? Які перетворення можна застосовувати до метричних ознак?
Операции с числами в интервальной метрической шкале.
1. Точка отсчета на шкале выбирается произвольно.
2. Применяются все методы описательной статистики (оценка средних величин, оценка разброса данных).
3. Применяются все параметрические и непараметрические критерии. Можно использоватькоэффициент парной корреляции Пирсона и коэффициенты множественной корреляции, что может предсказать изменения в одной переменной в зависимости от изменений в другой или в целом ряде переменных.
2. Наведіть приклади ознак, виміряних в порядковій шкалі.
Шкала отношения: 1 — плохое 2 — скорее плохое чем хорошее 3 — нейтральное 4 — скорее хорошее 5 — хорошее
3. Які математичні операції можна застосовувати до порядкових ознак? Які перетворення можна застосовувати до порядкових ознак?
рівність- нерівність, послідовність(більше ніж, краще ніж). Тут не як в метричних, тут нема чіткої відстані. Але ми знаємо, що 1 більше 2 а 3 більше 1 і 2 і т.д. , і равно-неравно .
Числа повинні бути різними. 1-2-3-4, 1-4-9-16…Важлива послідовність, а не відстань між числами. Числа тут виражають інтенсивність, а не реальну відстань.
Можемо міряти медіану(середнє впорядкованого ряду, центральна тенденція)
d коеф. Самерса, y коеф. Гудмана, коеф. Кендела. .
Наведіть приклад ознак, виміряних в номінальній шкалі. Стать. національність, місце проживанн
Які математичні операції можна застосовувати до номінальних ознак? Які перетворення можна застосовувати до номінальних ознак?
рівність нерівність, будь яке взаємне однозначне перетворення.
Можна подивитись на %.
Моду. Але не медіану, бо в ном. Шкалі ні фіга не впорядковано.
Критерій персона, коефіцієнт чупрова.
Дайте визначення квартилів. Скільки є квартилів? Для ознак в яких шкалах можуть обчислюватися ці показники
КваНтилі – показники, що ділять упорядкований ряд значень змінною у сукупності на n рівних частин.
Якщо n\1= 4, то ці показники назвають кваРтилями. Всього є 3 кваРтилі.
Різниця між 3 і 1 кваРтилями називають мірою варіації.
Квартиль 2 – медіана.
На малюнку вище – 25% обьєктів не перевищують 1 квартиль, 25% не менше ніж 3, 50% обьєктів між 1 і 3 знаходяться(порівнюють не самі обьєкти, а «значення змінної обьєкту)
Якщо n = 10, то показники називають децилями, яких всього 9.
Якщо n = 100, говорять про процентилі, яких 99. В інтервалі між 5 і 95 процентилєм 90% всіх значень змінної.
Міри варіації
Дайте визначення варіаційного розмаху. Якою є розмірність цього показника?характеризує діапазон варіації, це різниця між максимальним і мінімальним значеннями розмерность та же самая что и у перемеенной
8. Дайте визначення дисперсії. Якою є розмірність дисперсії? Для яких шкал можна обчислювати цей показник? Диспе́рсія є мірою відхилення значень випадкової величини від середнього значення. Зазвичай, обчислюється як стандартне відхилення, тобто, корінь квадратний з суми квадратів різниць між середнім та поточним значеннями, поділеної на кількість значень.