- •С татистика
- •Для самостійної роботи з дисципліни
- •1. Предмет і методи статистики
- •1.1.Загальне поняття про статистику та історія її виникнення
- •1.2. Предмет статистики
- •1.3. Методи статистики
- •1.4. Основні завдання статистики та її організація
- •2. Статистичне спостереження
- •2.1. Статистичне спостереження як метод інформаційного забезпечення
- •2.2. Програмно-методологічні питання статистичного спостереження
- •2.3.Організаційні питання статистичного спостереження
- •2.4. Форми, види, способи статистичного спостереження
- •3. Статистичні зведення, групування, таблиці
- •3.1. Суть статистичного зведення
- •3.2. Класифікації та групування
- •3.3. Прийоми статистичних групувань
- •3.3.1.Вибір ознаки групування
- •3.3.2.Визначення числа груп і розміру інтервалу
- •3.4. Ряди розподілу та їх види
- •3.5.Статистичні таблиці
- •Правила складання статистичних таблиць:
- •Статистичні показники
- •4.1.Суть і види статистичних показників
- •4.2. Абсолютні статистичні величини, їх суть, види, одиниці виміру
- •4.3. Відносні статистичні величини, їх суть, види та форми виразу
- •4.3.1.Види відносних величин
- •4.4. Середні величини, їх суть, умови використання, способи обчислення
- •4.4.1. Умови застосовування середніх
- •4.6. Обчислення середньої арифметичної інтервального ряду розподілу
- •5. Показники варіації
- •5.1.Необхідність вивчення варіації
- •5.2. Показники варіації
- •5.3. Характеристики форми розподілу
- •5.4. Дисперсія альтернативної ознаки
- •5.5. Види та взаємозв’язок дисперсій
- •6. Вибіркове спостереження
- •6.1.Суть вибіркового спостереження, його переваги перед суцільним спостереженням
- •6.2. Наукова організація вибіркового спостереження
- •6.3. Різновиди вибірок
- •6.4. Обчислення помилок вибірки
- •6.5. Визначення обсягу вибірки і способи поширення вибіркових даних
- •6.6. Способи поширення вибіркових даних на генеральну сукупність
- •6.7. Статистична перевірка гіпотез
- •7. Методи аналізу взаємозв’язків
- •7.1.Поняття про кореляційний аналіз
- •7.2. Коефіцієнт регресії
- •7.3. Визначення щільності зв’язку
- •7.4. Рангова кореляція Спірмена та Кендала
- •7.5. Аналіз взаємозв’язків між атрибутивними ознаками
- •8. Ряди динаміки
- •8.1. Суть і складові елементи динамічного ряду
- •8.2. Характеристики інтенсивності динаміки
- •8.3. Найважливіші прийоми аналізу рядів динаміки
- •1. Спосіб укрупнення інтервалів.
- •Вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •Вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •Середньомісячне вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •2. Метод рухливих (плинних) середніх.
- •Рухливі тричленні середні вивантаження вагонів за відділенням залізниці
- •Рухливі тричленні середні вивантаження вагонів за відділенням залізниці
- •8.4. Сезонні коливання
- •9. Індекси
- •9.2. Методологічні основи побудови зведених індексів
- •9.3. Принципи побудови агрегатних індексів
- •9.4. Взаємозв’язки індексів
- •Перетворення агрегатних індексів у середні
- •9.6. Індекси середніх величин
- •9.7. Територіальні індекси
- •10. Приклади розв’язування типових задач
- •10. 1. Зведення та групування даних
- •10.2.Статистичні показники
- •10.3. Показники варіації
- •10.4. Вибіркове спостереження
- •10.5. Методи аналізу взаємозв’язків
- •10.6.Ряди динаміки
- •Розв’язання.
- •10.7.Індекси
- •11. Варіанти контрольних робіт
- •12. Література
- •12.1.Основна література
- •12.2. Додаткова література
7.3. Визначення щільності зв’язку
Поряд з визначенням характеру зв’язку та ефектів впливу факторів на результат важливе значення має оцінка щільності зв’язку, тобто оцінку узгодженості варіації взаємопов’язаних ознак. Якщо вплив х на у значний, то це виявиться в закономірній зміні значень у зі зміною значень х, тобто фактор х своїм впливом формує варіацію у. За відсутності зв’язку варіація у не залежить від варіації х.
Для оцінки щільності зв’язку статистика використовує коефіцієнти з такими властивостями:
за відсутності біль-якого зв’язку значення коефіцієнта наближається до нуля; при функціональному зв’язку – до одиниці;
за наявності кореляційного зв’язку коефіцієнт виражається дробом, який тим за абсолютною величиною тим більший, чим щільніший зв’язок.
Серед мір щільності зв’язку найпоширенішим є коефіцієнт кореляції Пірсона. Позначається цей коефіцієнт символом r. Оскільки сфера його використання обмежується лінійною залежністю, то і в назві фігурує слово „лінійний”. Обчислення лінійного коефіцієнта кореляції ґрунтується на відхиленнях значень взаємозв’язаних ознак х і у від середніх:
.
Він набуває значень у межах ±1, тому характеризує не лише щільність, а й напрямок зв’язку. Додатне значення свідчить про прямий зв’язку, а від’ємне — про зворотній.
Відхилення емпіричних значень у від теоретичних називають залишковими. Вони характеризують вплив на результативну ознаку всіх інших факторів, окрім х. Середній квадрат цих відхилень визначає залишкова дисперсія:
Варіацію у, зумовлену впливом тільки фактора x, вимірює факторна дисперсія:
.
Частка факторної дисперсії у загальній характеризує щільність звязку і називається коефіцієнтом детермінації:
.
Він має такий же зміст, інтерпретацію та цифрові межі, як і 2.
Щільність
зв’язку оцінюється також індексом
кореляції
,
проте інтерпретується лише R2
.
Перевірка
істотності зв’язку здійснюється таким
же чином, як і в моделі аналітичного
групування, шляхом порівняння R2
і
.
Відмінності стосуються лише визначення
k1
= т
−
1
та k2
= п
−
т
у яких m
—
число параметрів рівняння регресії, а
п
−
кількість
спостережень. Гіпотеза, що перевіряється,
формулюється як нульова:
Н0: R2 = 0 або Н0: η2 = 0 .
Перевірка істотності зв’язку в обох моделях може здійснюватись також за F − критерієм Фішера, який функціонально зв’язаний з R2 та 2 так:
,
або
,
тому процедура перевірки та висновки ідентичні.
7.4. Рангова кореляція Спірмена та Кендала
В деяких випадках ми можемо зіткнутися з такими якостями, які не піддаються вираженню числом одиниць.
Ці обставини заставляють застосовувати “не параметричні методи”, які дають змогу вимірювати інтенсивність зв’язків між кількісними ознаками, форма розподілу яких відрізняється від нормального і між якісними ознаками. В основу не параметричних методів покладено принцип нумерації варіант ряду. Взаємозв’язок між ознаками, які можна зранжувати, передусім на основі бальних оцінок, вимірюється методами рангової кореляції. Кожній одиниці сукупності присвоюється порядковий номер в ряді, який буде впорядковано за рівнем ознаки. Таким чином, ряд значень ознаки впорядковується, а номер кожного окремого значення називатиметься її рангом.
Ранжування проводиться за кожною ознакою окремо: перший ранг надається найменшому значенню ознаки, останній — найбільшому або навпаки. Кількість рангів дорівнює обсягу сукупності. Очевидно, зі збільшенням обсягу сукупності ступінь „розпізнаваності” елементів зменшується. З огляду на те, що рангова кореляція не потребує додержання будь-яких математичних передумов щодо розподілу ознак, зокрема вимоги нормальності розподілу, рангові оцінки щільності зв’язку доцільно використовувати для сукупностей невеликого обсягу.
Ранги,
надані елементам сукупності за ознаками
х
і
у,
позначають
відповідно Rx
та
Ry.
Залежно
від ступеня зв’язку між ознаками
певним чином співвідносяться й ранги.
При прямому функціональному
зв’язку Rx
=
Ry
тобто відхилення між рангами d
= Rx
−
Ry
= 0, отже, і сума квадратів відхилень
.
При зворотному функціональному зв’язку
,
де п
—
число
рангів. Якщо зв’язок між ознаками
відсутній,
являє
собою
середню арифметичну цих крайніх значень:
Обчислення коефіцієнта кореляції Спірмена ґрунтується на вивченні різниці рангів значень факторної та результативної ознаки:
,
де
di
−
відхилення рангів
факторної та результативної ознак
(різниця), n
— кількість рангів.
і
одночасно оцінює щільність зв’язку та
його напрямок.
Кендал запропонував так знаходити коефіцієнт кореляції:
,
де S – сума балів при умові, що балом +1 оцінюється пара рангів, які мають за обома ознаками однаковий порядок, а балом –1 – пара рангів з оберненим порядком.
Алгоритм обчислення коефіцієнта рангової кореляції Кендала:
1) впорядковуємо ряд значень ознаки х за зростанням і вказуємо ранги ознаки у відповідно;
2) обчислюємо бали для всіх рангів за ознакою у. Для цього визначаємо, скільки рангів, які знаходяться перед та після даного, перевищують його. Перше число записуємо зі знаком “−”, друге – зі знаком “+”.
3) знаходимо суму балів за всіма рангами;
4)
обчислюємо значення коефіцієнта
.
Зауваження: якщо значення ознаки у однакові, то однаковими повинні бути і їх ранги. Для цього з рангів, які б мали бути присвоєнні різним значенням, знаходять середній і присвоюють кожному з рівних значень. Наприклад ( таб. 7.4.1):
Таблиця 7.4.1
Порядковий номер спостереження |
Значення ознаки у |
Ранги ознаки у |
1 |
5,5 |
4,5= ((4+5)/2) |
2 |
4,1 |
3 |
3 |
5,5 |
4,5= ((4+5)/2) |
4 |
2,0 |
1 |
5 |
3,5 |
2 |
При
достатній кількості спостережень
