
- •1. Які математичні операції можна застосовувати до метричних ознак? Які перетворення можна застосовувати до метричних ознак?
- •2. Наведіть приклади ознак, виміряних в порядковій шкалі.
- •3. Які математичні операції можна застосовувати до порядкових ознак? Які перетворення можна застосовувати до порядкових ознак?
- •Які математичні операції можна застосовувати до номінальних ознак? Які перетворення можна застосовувати до номінальних ознак?
- •Дайте визначення квартилів. Скільки є квартилів? Для ознак в яких шкалах можуть обчислюватися ці показники
- •9. Дайте визначення коефіцієнту варіації. Якою є розмірність цього показника? Які значення може приймати коефіцієнт варіації?
- •Які параметри має нормальний розподіл? Якою є сфера основного застосування цього розподілу?
- •.Які параметри має розподіл 2 ? Якою є сфера основного застосування цього розподілу?
- •Які параметри має розподіл Фішера? Якою є сфера основного застосування цього розподілу?
- •2. В якому випадку говорять про кореляційний зв'язок між двома ознаками? Наведіть приклади.
- •1. Дайте визначення статистичної гіпотези.
- •2. Запишіть приклад нульової та альтернативної до неї статистичної гіпотези.
- •3. Дайте визначення помилки першого роду.
- •4. Дайте визначення помилки другого роду.
- •9. Як оцінюється значущість коефіцієнтів Чупрова та Крамера?
- •6. З якою метою оцінюють значущість різниці середніх? Поясніть на прикладі.
- •Регресія
- •Як інтерпретуються коефіцієнти регресії в рівнянні лінійної регресії?
- •Дайте визначення рівняння лінійної регресії в нормальних (стандартних) координатах. В чому його специфіка по відношенню до звичайного рівняння лінійної регресії?
- •Які Ви знаєте підходи до оцінювання якості рівняння регресії?
- •Як обчислюється і який зміст має коефіцієнт детермінації?
- •Як інтерпретується коефіцієнт множинної кореляції?
- •Дайте визначення лінійного і нелінійного зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Дайте визначення прямого і зворотнього зв’язків. Проілюструйте свою відповідь діаграмою розсіяння.
- •Які значення може приймати коефіцієнт Пірсона?
- •Наявність якого зв’язку фіксує коефіцієнт кореляції Пірсона?
- •Як інтерпретуються значення коефіцієнту кореляції Пірсона?
- •Поясніть поняття хибної залежності та хибної незалежності між двома ознаками.
- •Яку інформацію про причинно-наслідковий характер зв’язку дає коефіцієнт кореляції Пірсона?
- •Яке співвідношення між значеннями коефіцієнту кореляції Пірсона та кореляційного відношення?
- •Дайте визначення кластера.
- •Як застосовується кластерний аналіз для побудови типологій об'єктів?
- •Як застосовується кластерний аналіз для групування ознак?
- •Наведіть аксіоми відстані.
- •5. Які ви знаєте визначення відстаней для ознак, виміряних в метричних шкалах?
- •Які ви знаєте визначення відстаней для ознак, виміряних в номінальних шкалах?
- •Як можна оцінити надійність проведеного розбиття на кластери?
- •12. Які особливості структури матриці відстаней?
- •14.Сформулюйте загальну схему алгоритму k-means Cluster (Quick Cluster), реалізованого в пакеті spss. В чому особливості цього алгоритму у порівнянні з ієрархічним кластерним аналізом?
- •Формулы для решения зад ач
Формулы для решения зад ач
Для номінальних змінних як міри центральної тенденції часто
використовують моду - значення змінної з найбільшою частотою.
Використовувати моду доцільно для дискретних змінних із невеликою
кількістю можливих значень (невеликою кількістю категорій).
Иногда бывает больше чем одна мода.
Медиана (50-й процентиль, квантиль 0,5) — возможное значение признака, которое делит ранжированную совокупность (вариационный ряд выборки) на две равные части: 50 % «нижних» единиц ряда данных будут иметь значение признака не больше, чем медиана, а «верхние» 50 % — значения признака не меньше, чем медиана.
Д
ля
кількісних змінних як міри варіації
використовують дисперсію.
Стандартное отклонение — корень из дисперсии
чтобы узнать однородны ли совокупности юзаем коэффициент вариации. Делим стандартное отклонение на среднее и вуаля. Если получившаяся хрень меньше 0.3 0.4, то все ок — совокупности однородны, если больше, то нет.
Коефіцієнт варіації (рос. коэффициент вариации, англ. variation coefficient, нім. Variationsbeiwert m) — відносна величина, що служить для характеристики коливання (мінливості) ознаки. Являє собою відношення середнього квадратичного відхилення τ до середнього арифметичного Х, виражається у відсотках: ν = τ/Х.
Будуємо довірчий інтервал для довірчої ймовірності 0.95. Маємо
обсяг вибірки , частка потрібної нам властивості у вибірці
.
Оскільки та , то для
довірчої ймовірності 0.95 маємо такий довірчий інтервал для частки
об'єктів із потрібною нам властивістю:
Інакше кажучи, з ймовірністю 0.95 можна стверджувати, що в
генеральній сукупності (а для цього дослідження генеральною
сукупністю було населення міста Києва у віці 18 років та старше)
відсоток тих, хто оцінює минулий рік як кращий ніж попередній,
міститься в інтервалі від 0,7 % до 3,5 %.
Варіаційний розмах характеризує діапазон варіації, це різниця між максимальним і мінімальним значеннями
ознаки: |
|
Загальний обсяг вибірки після зважування мас бути 430 і 46 %
мають становити чоловіки. Інакше кажучи, після зважування у вибірці
має бути 430x0.46 чоловіків. Серед них 42,2 % - чоловіки із
вищою освітою. Отже, після зважування у нас має бути
чоловіків із вищою освітою.
Проте у нашому файлі даних
є 95 чоловіків із вищою освітою
Отже, кожному зі спостережень, що
стосуються цієї групи (тобто спостережень, що відповідають умові
(vl65=1 and vl67=l)) потрібно присвоїти вагу, що обчислюється за
ф
ормулою
чоловыкыв - 285 анкет. 44, 4%
жінок - 357 анкет , 55.6%
всего данкет - 642.
а у нас есь данніе, что члолвіків 46%, а жінок - 54%
285/0.46 = 620 (22 жін. анкети зайві)
виходить, щщо 285/335(чол./жінки)