
- •1. Які математичні операції можна застосовувати до метричних ознак? Які перетворення можна застосовувати до метричних ознак?
- •2. Наведіть приклади ознак, виміряних в порядковій шкалі.
- •3. Які математичні операції можна застосовувати до порядкових ознак? Які перетворення можна застосовувати до порядкових ознак?
- •Які математичні операції можна застосовувати до номінальних ознак? Які перетворення можна застосовувати до номінальних ознак?
- •Дайте визначення квартилів. Скільки є квартилів? Для ознак в яких шкалах можуть обчислюватися ці показники
- •9. Дайте визначення коефіцієнту варіації. Якою є розмірність цього показника? Які значення може приймати коефіцієнт варіації?
- •Які параметри має нормальний розподіл? Якою є сфера основного застосування цього розподілу?
- •.Які параметри має розподіл 2 ? Якою є сфера основного застосування цього розподілу?
- •Які параметри має розподіл Фішера? Якою є сфера основного застосування цього розподілу?
- •2. В якому випадку говорять про кореляційний зв'язок між двома ознаками? Наведіть приклади.
- •1. Дайте визначення статистичної гіпотези.
- •2. Запишіть приклад нульової та альтернативної до неї статистичної гіпотези.
- •3. Дайте визначення помилки першого роду.
- •4. Дайте визначення помилки другого роду.
- •9. Як оцінюється значущість коефіцієнтів Чупрова та Крамера?
- •6. З якою метою оцінюють значущість різниці середніх? Поясніть на прикладі.
- •Регресія
- •Як інтерпретуються коефіцієнти регресії в рівнянні лінійної регресії?
- •Дайте визначення рівняння лінійної регресії в нормальних (стандартних) координатах. В чому його специфіка по відношенню до звичайного рівняння лінійної регресії?
- •Які Ви знаєте підходи до оцінювання якості рівняння регресії?
- •Як обчислюється і який зміст має коефіцієнт детермінації?
- •Як інтерпретується коефіцієнт множинної кореляції?
- •Дайте визначення лінійного і нелінійного зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Дайте визначення прямого і зворотнього зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Які значення може приймати коефіцієнт Пірсона?
- •Наявність якого зв’язку фіксує коефіцієнт кореляції Пірсона?
- •Як інтерпретуються значення коефіцієнту кореляції Пірсона?
- •Поясніть поняття хибної залежності та хибної незалежності між двома ознаками.
- •Яку інформацію про причинно-наслідковий характер зв’язку дає коефіцієнт кореляції Пірсона?
- •Яке співвідношення між значеннями коефіцієнту кореляції Пірсона та кореляційного відношення?
- •Дайте визначення кластера.
- •Як застосовується кластерний аналіз для побудови типологій об'єктів?
- •Як застосовується кластерний аналіз для групування ознак?
- •Наведіть аксіоми відстані.
- •5. Які ви знаєте визначення відстаней для ознак, виміряних в метричних шкалах?
- •Які ви знаєте визначення відстаней для ознак, виміряних в номінальних шкалах?
- •Як можна оцінити надійність проведеного розбиття на кластери?
- •12. Які особливості структури матриці відстаней?
- •14.Сформулюйте загальну схему алгоритму k-means Cluster (Quick Cluster), реалізованого в пакеті spss. В чому особливості цього алгоритму у порівнянні з ієрархічним кластерним аналізом?
- •Формулы для решения зад ач
Яке співвідношення між значеннями коефіцієнту кореляції Пірсона та кореляційного відношення?
Часто кореляційне відношення розглядають у співвідношенні з коефіцієнтом кореляції Пірсона:
Якщо r 2yх = 0 – якщо немає лінійного зв’язку, то наявний певний нелінійний зв'язок
Якщо r 2yх<= ^2 - лінійність є частковим випадком не лінійності.
Якщо r 2yх= ^2 = 1 – між змінними Х та У є строга залежність.
Якщо r 2yх= ^2 < 1 – існує кореляційний, функціональний зв’язок, але не функціональний.
Якщо r 2yх< ^2 = 1 – існує нелінійний зв'язок, але функціональний.
Якщо r 2yх< ^2 < 1 – немає функціональної залежності, зв'язок нелінійний, але кореляційний.
^2 - r 2yх – міра не лінійності зв’язку:
Якщо ^2 - r 2yх = 0, то більш лінійний зв’язок
Якщо ^2 - r 2yх = 1, то більш нелінійний зв’язок.
Наявність зв’язку розглядається як коваріація.
Розставте ранги ряду значень 22 31 12 34 12 10 4 31.
Процедура ранжування даних полягає у присвоєнні їм певних чисел (рангів), що відповідають їхньому номеру у цьому ряді:
1. 4 - 1
2. 10 – 2,5
3. 12 – 3,5
4. 12 – 3,5
5. 22 – 4,5
6. 31 – 6,5
7. 31 – 6,5
8. 34 – 7,5
***
1. 22 - 4,5
2. 31 - 5
3. 12 – 4
4. 34 – 5,5
5. 12 - 4
6. 10 – 3
7. 4 – 1
8. 31 - 5
Факторний аналіз
Сформулюйте головну iдею факторного аналiзу.
Присутність кореляцій між безпосередньо виміряними ознаками може бути пояснена тим, що існує невелика кількість латентних факторів, що впливаєть на ці ознаки, цей вплив спостерігається у вигляді кореляцій між ознаками. Суть факторного аналізу полягає у заміні великої кількості ознак, що описують об”єкт спостереження, меншим числом комплексних характеристик, тобто факторів.
Поясніть особливості структури кореляцiйної матриці.
У кореляційній матриці є три стовпчики: назва ознаки, її початкові і отримані значення. Початкові значення = 1, отримані значення показують наскільки вагомою є змінна.
Кореляційну матрицю краще використовувати при суттєвій різниці дисперсії і у випадку, якщо ознаки виміряні у різних одиницях.
Сформулюйте різницю між методами лiнiйного факторного аналізу та методами нелiнiйного факторного аналiзу?
Лінійний – розвідувальний факторний аналіз. Грунтується на кооф. корел Пірсона. Методи: головні компоненти(не передбач специфічні фактори), головні фактори (основний результат: матриця факторного навантаження(факторна структура)).
Нелінійний – конфірматорний аналіз – застосовується для підтвердження або спостування наявної гіпотези.
Яким вимогам повинні задовольняти дані для того, щоб до них можна було застосовувати методи факторного аналiзу?
Дані мають бути такими, щоб для них можна було виміряти коофіцієнт Пірсона, мають бути помірно скорельовані. Для того, щоб можна було виділити фактор необхідно мінімум 3 ознаки. Кількість об”єктів має перевищувати кількість ознак у 8-10 разів.
Дайте визначення матриці факторних навантажень. Як інтерпретується факторне навантаження?
Матриця факторних навантажень – спосіб представлення результатів факторного аналізу. Рядки в матриці відповідають змінним, стовпчики – виділеним латентним факторам, на перетині вказується значення навантаження, що є значенням кореляції ознаки з фактором. чим більшою є факторне навантаження, тим тісніше корелює ознака з фактором.
Дайте визначення факторного значення.
Факторне значення – оцінка латентного фактора тими термінами, якими описуються змінні.
Дайте визначення загальності ознаки.
Загальність ознаки – доля дисперсії змінної, що належить загальним факторам і розділяється з іншими змінними.
Дайте визначення специфiчності ознаки.
Доля дисперсії змінної, що не описується загальними факторами.
Як здiйснюється змiстовна iнтерпретацiя факторiв?
Вона здійснюється на основі матриці факторних навантажень, при цьому враховуються значення навантажень та їх знаки. При інтерпретації беруться до уваги ті змінні, що мають найбільше факторне навантаження.
В чому полягає проблема оцiнювання загальностi?
Вона полягає у тому, що існують навантаження, які ми не маємо можливості пояснити. Для усунення проблеми можна використовувати метод мінімальних факторних залишків.
Назвіть особливостi моделi головних компонентiв.
Першочергове число компонент = числу ознак, в ході обрахунків отримуються всі головні компоненти. При застосуванні моделі передбачається можливість повного розкладу дисперсії ознак, тобто повне пояснення через латентні фактори. Даний метод використовується для формування некорельованих лінійних комбінацій змінних, використовується для отримання початкового факторного рішення.
Назвіть особливостi моделi головних факторiв.
Особливістю моделі є те, що, на відміну від моделі головних компонент, в якій компоненти є лінійними функціями від змінних, фактори не виражаються через спостережувані змінні. Крім того, передбачається наявність характеристик факторів.
З якою метою виконують обертання (ротацiю) факторiв?
Існує декілька основних методів обертання факторів, метою яких є отримання зрозумілої матриці навантажень, тобто такої, фактори якої відмічені високими навантаженнями одних ознак і низькими інших.
вращение никак не улучшает факторное решение. дисперсия остается такой же, но после вращение дисперсия перераспределяется между факторами. В это кагбе и суть.
Основные методы:
varimax - "побольше нулей" в каждом столбике матрицы факторных нагрузок (столбик фактора) облегчает интерпретацию фактора.
Quarimax - «побольше нулей» в строках. Облегчает интерпретацию первичного признака.
Equamax - «баланс» между кваримакс и варимакс
oblimin – дает систематизацию факторов, которые коррелируют между собой
Чи можна застосовувати факторний аналiз до ознак, вимiряних в номiнальних шкалах?Не можна, для номінальних шкал слід застосовувати кластерній аналіз.
Кластерный анализ