
- •1. Які математичні операції можна застосовувати до метричних ознак? Які перетворення можна застосовувати до метричних ознак?
- •2. Наведіть приклади ознак, виміряних в порядковій шкалі.
- •3. Які математичні операції можна застосовувати до порядкових ознак? Які перетворення можна застосовувати до порядкових ознак?
- •Які математичні операції можна застосовувати до номінальних ознак? Які перетворення можна застосовувати до номінальних ознак?
- •Дайте визначення квартилів. Скільки є квартилів? Для ознак в яких шкалах можуть обчислюватися ці показники
- •9. Дайте визначення коефіцієнту варіації. Якою є розмірність цього показника? Які значення може приймати коефіцієнт варіації?
- •Які параметри має нормальний розподіл? Якою є сфера основного застосування цього розподілу?
- •.Які параметри має розподіл 2 ? Якою є сфера основного застосування цього розподілу?
- •Які параметри має розподіл Фішера? Якою є сфера основного застосування цього розподілу?
- •2. В якому випадку говорять про кореляційний зв'язок між двома ознаками? Наведіть приклади.
- •1. Дайте визначення статистичної гіпотези.
- •2. Запишіть приклад нульової та альтернативної до неї статистичної гіпотези.
- •3. Дайте визначення помилки першого роду.
- •4. Дайте визначення помилки другого роду.
- •9. Як оцінюється значущість коефіцієнтів Чупрова та Крамера?
- •6. З якою метою оцінюють значущість різниці середніх? Поясніть на прикладі.
- •Регресія
- •Як інтерпретуються коефіцієнти регресії в рівнянні лінійної регресії?
- •Дайте визначення рівняння лінійної регресії в нормальних (стандартних) координатах. В чому його специфіка по відношенню до звичайного рівняння лінійної регресії?
- •Які Ви знаєте підходи до оцінювання якості рівняння регресії?
- •Як обчислюється і який зміст має коефіцієнт детермінації?
- •Як інтерпретується коефіцієнт множинної кореляції?
- •Дайте визначення лінійного і нелінійного зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Дайте визначення прямого і зворотнього зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Які значення може приймати коефіцієнт Пірсона?
- •Наявність якого зв’язку фіксує коефіцієнт кореляції Пірсона?
- •Як інтерпретуються значення коефіцієнту кореляції Пірсона?
- •Поясніть поняття хибної залежності та хибної незалежності між двома ознаками.
- •Яку інформацію про причинно-наслідковий характер зв’язку дає коефіцієнт кореляції Пірсона?
- •Яке співвідношення між значеннями коефіцієнту кореляції Пірсона та кореляційного відношення?
- •Дайте визначення кластера.
- •Як застосовується кластерний аналіз для побудови типологій об'єктів?
- •Як застосовується кластерний аналіз для групування ознак?
- •Наведіть аксіоми відстані.
- •5. Які ви знаєте визначення відстаней для ознак, виміряних в метричних шкалах?
- •Які ви знаєте визначення відстаней для ознак, виміряних в номінальних шкалах?
- •Як можна оцінити надійність проведеного розбиття на кластери?
- •12. Які особливості структури матриці відстаней?
- •14.Сформулюйте загальну схему алгоритму k-means Cluster (Quick Cluster), реалізованого в пакеті spss. В чому особливості цього алгоритму у порівнянні з ієрархічним кластерним аналізом?
- •Формулы для решения зад ач
Які параметри має розподіл Фішера? Якою є сфера основного застосування цього розподілу?
Распределе́ние Фи́шера в теории вероятностей — это двухпараметрическое семейство абсолютно непрерывных распределений.
Параметры -
числа степеней свободы
Графік відносної щільності є графіком розподілу.
Основна сфера застосування – порівняння дисперсій.
Коефіцієнти
Коэффициент Чупрова измеряет взаимосвязь качественных неальтернативных признаков, измеренных по номинальной шкале. Подсчитывается по формуле:
КРАМЕР
Коефіцієнт крамера, х2 – модель відмінності від статистичної незалежності .А ще
- називається коефіцієнт асоціації. (phi and cramer’s V) – чим більшим є значення, тим сильнішим є звьязок. Може набувати значень від 0 до 1. 0 – нема звьязку, 1 – повний.
Коэффициент Крамера подсчитывается для неальтернативных признаков, измеренных по номинальной шкале, по формуле:
ГУДМАН
Гудман – поліпшує передбачення значення однієї ознаки на основі значення другої (лямбда…не блямбда, а именно лямбда). Виділяються незалежна і залежна змінна. Гудман передбачає розгляд можливості передбачити залежну на основі відомого значення незалежної. ЧИМ БІЛЬШЕ ЗНАННЯ НЕЗАЛЕЖНОЇ ЗМІННОЇ ЗМЕНШУЄ ПОМИЛКУ В ПЕРЕДБ. ЗАЛЕЖНОЇ, ТИМ СИЛЬНІШЕ ЗВЬЯЗОК.
- простіше: лямбда від 0 до 1, і позначає яка частка зменшення помилки передбачення залежної на основі незалежної. 0 – нема впливу незалежної ознаки. 1 – повний вплив. 0.3 – помірний вплив, (30 %..і за такою ж логікою будь яке…)
Пірсон:
Від -1 до 1. Додатнє значення – позитивний звьязок, відьємне – негативний. (зворотній). Позначається як R. Якщо воно = 0, нема лінійного звьязку. Якщо 1 – прямий функціональний. -1 – зворотній функціональний.
Спірмен – (коеф. Рангової кореляції). позначають як р. від -1 щдо 1. 1 – однакове впорядкування рангів значень двох ознак. -1 – зворотнє впгорядкування рангів значень двох ознак. 0 – нема звьязку між порядком рангів значень двох ознак.
- ЗАСТОСОВУЮТЬ ДЛЯ ДВОХ ПОРЯДКОВИХ
W Кендала
- Коэффициент согласованности Кендала (W) измеряет степень согласованности между несколькими связанными выборками. Коэффициент согласованности может принимать значения между 0 и 1. Значение 1 соответствует наличию полного согласия., - 1 – максимально можливий негативний звьязок.
- позначається як «тау»(там віебнутій символ, уж извините).
- ЗАСТОСОВУЮТЬ ДЛЯ ДВОХ РАНГОВИХ ЗМІННИХ
(пример – 3 газеты оценивали футболистов от 1 до 6 баллов. Можно узнать насколько согласнованно)
Колмогоров-Смирнов
- тест Колмогорова-Смирнова для одной выборки, который может применяться для проверки наличия нормального распределения.
Основой теста является расчет максимальной разности между кумулятивными частотами обеих выборок. Эта разность обозначается величиной z, на основании которой, выводится вероятность ошибки р.
Отклонение от нормального распределения считается существенным при значении р < 0,05(тоесть, если меньше – то различие значимо, и это НЕ нормальное распределение).
Як співвідносяться чупров і крамер?
Для всіх коефіцієнтів побудованих для х2, значущість оцінюється на основі значущості х2(значущий він – значущі інши, навпаки – навпаки).
В квадратних таблицях(де кількість категорій в обох ознаках однакова) – чупров і крамер однакові, дорівнюють між собою
Для витягнутих таблиць Крамер більше ніж чупров (максимум поділений на мінімум)
Ета2 завжди не менше ніж R квадрат.(більше або дорівнює).
Якщо вони дорывнюють – лыныиний звьязок
Якщо ета2 быльше R – нелінійна компонента є.
Распределе́ние Фи́шера в теории вероятностей - это двухпараметрическое семейство абсолютно непрерывных распределений.
НЕ ГЛАВНЫЕ
U-тест по методу Манна и Уитни
- Это самый известный и самый распространенный тест непараметрического сравнения двух независимых выборок
Тест Мозеса (Moses)
Данный тест проверяет различие размаха двух независимых выборок, которые состоят из переменных, относящихся к порядковой шкале, причем одна выборка рассматривается как контрольная группа, а другая как экспериментальная.
Тест хи-квадрат по методу МакНемара (McNemar)
Данный тест применяется исключительно при наличии дихотомических переменных. При этом для двух зависимых переменных выясняется, происходят ли какие-либо изменения в структуре распределения их значений. В большинстве наблюдений сравнение проводится с учётом временного фактора по схеме "до — после".
Тест Фридмана
Он основывается на ранговых последовательностях, которые строятся для значений всех переменных участвующих в тесте.
довірчі інтервали, точкове оцінювання
Дайте визначення такої властивості оцінки статистичного показника, як незсунутість.
Незсунутість – якщо середнє вибіркове розподілу дорівнює параметру генеральної сукупності.
Середнє вибіркове:
Тоді, незсунутість означає:
ОДНАК!!!!!!!!
Вибіркова дисперсія є ЗСУНУТОЮ оцінкою!!!! Тому що:
Для того, щоб вона не була зсунутою використовують таку формулу:
Дайте визначення такої властивості оцінки статистичного показника, як обгрунтованість.
Оцінка є обґрунтованою, коли при збільшенні обсягу вибірки оцінка параметру прямує до параметрів генеральної сукупності.
Дайте визначення такої властивості оцінки статистичного показника, як ефективність.
Ефективність – є тим вищою, чим меншою є дисперсія.
В чому полягає суть інтервального оцінювання?
Мета – побудувати інтервал на числовій осі, одна з точок якого співпадає за параметрами генеральної сукупності.
Імовірність попадання – «довірча імовірність»
Сформулюйте загальний підхід до побудови довірчого інтервалу певної статистики.
Інтервал будується на основі граничної теореми.
Розподіл
Ст’юдента.
Якщо від середнього вибіркового відкласти в право і в ліво по 1,96 – ми гарантовано отримаємо інтервал, в якому буде присутнє середнє генеральне з імовірністю 0,95.
Для імовірності 0,99 – по 2,54.
Для одного й того ж самого середнього обчислено два довірчі інтервали - для ймовірності 0.99 та для ймовірності 0.95. Як ці два інтервали співвідносяться між собою (перетинаються, не перетинаються, співпадають, містяться один в одному, ніяк не співвідносяться тощо)?
Интервал 0,95 міститься в интервалі 0,99. График – сверху, все понятно)
Дайте пояснення до фрази "Довірчий інтервал для середньої заробітної плати робітників галузі є від 450 грн. до 487 грн. з довірчою ймовірністю 0.99".
Це означає, що якщо ми випадковим чином оберемо робітника даної галузі, то з імовірністю 0,99 величина його заробітної плати потрапить у інтервал від 450грн до 487грн.
Похибки першого роду і похибки другого роду в математичній статистиці — це ключові поняття завдань перевірки статистичних гіпотез.
Зв'язок
1.В якому випадку говорять про функціональний зв'язок між двома ознаками? Наведіть приклади.
Функціональний зв'язок – коли кожному х відповідає конкретне значення у.
Приклад:
у – стаж
х – кількість відпрацьованих років
Тоді:
у=ax+b (b – попереднє відпрацювання, а – умови праці)