- •1.1. Предмет статистики.
- •1.2. Основні категорії статистики
- •1.3. Методи статистики
- •1.4. Основні завдання статистики на сучасному етапі
- •Тема 2. Статистичне спостереження План
- •2.1. Сутність та форми статистичного спостереження
- •2.2. Планування статистичного спостереження
- •2.3. Види статистичного спостереження та способи одержання інформації
- •2.4. Помилки спостереження
- •Тема 3. Зведення та групування статистичних даних План
- •3.1. Статистичне зведення та статистичні таблиці.
- •3.2. Статистичне групування.
- •3.3. Ряди розподілу.
- •3.1. Статистичне зведення та статистичні таблиці
- •Назва таблиці (що, де, коли)
- •3.2. Статистичне групування
- •Поділ населення регіону, млн осіб, за місцем проживання
- •Динаміка зубожіння населення болгарії, %, по роках
- •Комбінаційний поділ робітників
- •Залежність урожайності озимої пшениці від терміну збирання
- •Варіанти формування інтервалів групувань за рівнем прибутковості, %
- •Поділ працюючих за рівнем середньомісячної заробітної плати
- •Вторинне групування працюючих за рівнем середньомісячної заробітної плати
- •3.3. Ряди розподілу
- •Закономірність розподілу
- •Частотні характеристики рядів розподілу
- •Розподіл фірм регіону за рівнем фондоозброєності праці
- •Розподіл робітників за рівнем кваліфікації
- •Характеристики центру розподілу
- •Розподіл домогосподарств міста за рівнем забезпеченості житлом
- •Характеристики варіації
- •Коефіцієнти k для різного обсягу сукупності
- •До розрахунку узагальнюючих характеристик варіації
- •Характеристики форми розподілу
- •До розрахунку коефіцієнта концентрації
- •Коефіцієнти територіальної локалізації
- •Галузева структура зайнятості населення
- •Структура та структурні зрушення споживання палива по роках
- •Види та взаємозв’язок дисперсій
- •Розрахунок загальної та групових дисперсій якості сиру
- •До розрахунку міжгрупової та середньої з групових дисперсій
- •Тема 4. Статистичні показники План
- •4.2. Абсолютні статистичні величини та одиниці їх вимірювання
- •4.1. Суть та види статистичних показників
- •4.2. Абсолютні статистичні величини та одиниці їх вимірювання
- •4.3. Відносні величини та їх характеристика
- •Відносні величини динаміки
- •Відносні величини просторових порівнянь
- •Відносні величини порівняння зі стандартом
- •Відносні величини структури
- •Відносні величини координації
- •Відносні величини інтенсивності
- •4.4. Середні величини та загальні умови їх застосування
- •Види середніх величин та способи їх обрахування
- •Математичні властивості середньої
- •Середні структурні
- •Нормований середній бал
- •Середня арифметична
- •Ставлення населення до смертної кари
- •Середня гармонічна
- •Середня геометрична
- •4.5. Система статистичних показників
- •Тема 5. Вибірковий метод у статистиці План
- •5.1. Суть вибіркового спостереження
- •5.2. Вибіркові оцінки середньої та частки
- •5.3. Різновиди вибірок і способи відбору одиниць з генеральної сукупності
- •5.4. Помилки вибірки
- •Тема 6. Статистичні методи вимірювання взаємозв’язків План
- •6.1. Види взаємозв’язків
- •Види взаємозв’язків і їх особливості
- •Комбінаційний розподіл шахт за глибиною розробки пластів та фондомісткістю вугілля
- •6.2. Кореляційно-регресійний аналіз
- •До розрахунку параметрів лінійної регресії, теоретичних рівнів і залишкових величин
- •6.3. Оцінка щільності та перевірка істотності кореляційного зв’язку
- •До розрахунку загальної дисперсії фондомісткості вугілля ( )
- •До розрахунку факторної дисперсії фондомісткості вугілля ( )
- •6.4. Рангова кореляція
- •До розрахунку коефіцієнта рангової кореляції
- •6.5. Оцінка узгодженості варіації атрибутивних ознак
- •Розподіл респондентів за віком і схильністю до ризику
- •Критичні значення
- •Розподіл пацієнтів клініки за результатами легеневих проб
- •Тема 7. Аналіз інтенсивності динаміки План
- •7.1. Суть і складові елементи динамічного ряду
- •Види рядів динаміки
- •Зімкнення динамічних рядів
- •7.2. Характеристики інтенсивності динаміки
- •Абсолютні та відносні характеристики динаміки
- •Аналітичні показники ряду динаміки
- •Середні показники динаміки
- •Розрахунок тенденції
- •Коефіцієнт випередження
- •Екстраполяція та інтерполяція.
- •Тема 8. Аналіз тенденції розвитку План
- •8.1. Середня абсолютна та відносна швидкість розвитку
- •8.2. Характеристика основної тенденції розвитку
- •Розрахунок ковзних середніх урожайності зернових
- •Динаміка видобутку нафти
- •8.3. Оцінка коливань та сталості динаміки
- •Щомісячна динаміка споживання електроенергії
- •Тренд і сезонні коливання продажу безалкогольних напоїв
- •До розрахунку залишкової дисперсії
- •Тема 9. Індекси План
- •9.1. Суть і функції індексів
- •9.2. Методологічні основи побудови зведених індексів
- •9.3. Агрегатна форма індексів
- •Формули індексів цін і фізичного обсягу за різних систем зважування
- •До розрахунку агрегатних індексів цін і фізичного обсягу
- •9.4. Середньозважені індекси
- •До розрахунку середньозважених індексів цін і фізичного обсягу
- •До розрахунку середньозважених індексів з відносними вагами
- •9.5. Взаємозв’язки індексів
- •9.6. Індекси середніх величин
- •До розрахунку індексів середніх величин
- •До розрахунку системи індексів структурних зрушень
- •Територіальні індекси
- •Товарна маса і ціни експорту
- •Індивідуальні індекси
- •Агрегатні індекси
- •Взаємозв'язок індексів
- •Правило зважування індексів.
- •Середні індекси
- •Розрахунок середнього арифметичного індексу фізичного обсягу
- •Розрахунок середнього геометричного індексу ціни
- •Індекси середніх величин.
- •Тема 10. Графічний метод у статистиці План
- •10.2. Типи діаграм
- •10.3. Картограми та картодіаграми
6.2. Кореляційно-регресійний аналіз
Важливою
характеристикою кореляційного зв’язку
є лінія
регресії
— емпірична в моделі аналітичного
групування і теоретична в моделі
регресійного аналізу. Емпірична
лінія регресії
представлена груповими середніми
результативної ознаки
,
кожна з яких належить до відповідного
інтервалу значень групувального фактора
хj.
Теоретична
лінія регресії
описується певною функцією
яку називають рівнянням
регресії,
а Y
— теоретичним
рівнем результативної ознаки.
На
відміну від емпіричної, теоретична
лінія регресії неперервна. Так, уважають,
що маса дорослої людини в кілограмах
має бути на 100 одиниць менша за її зріст
у сантиметрах. Співвідношення між масою
і зростом можна записати у вигляді
рівняння:
,
де у
— маса; х
— зріст.
Безперечно, така форма зв’язку між масою та зростом людини надто спрощена. Насправді збільшення маси не жорстко пропорційне до збільшення зросту. Люди одного зросту мають різну масу, проте в середньому зі збільшенням зросту маса зростає. Для точнішого відображення зв’язку між цими ознаками в рівняння слід увести другий параметр, який був би коефіцієнтом пропорційності при х, тобто Y = – 100 + bx.
Рівняння регресії в такому вигляді описує числове співвідношення варіації ознак х і у в середньому. Коефіцієнт пропорційності при цьому відіграє визначальну роль. Він показує, на скільки одиниць у середньому змінюється у зі зміною х на одиницю. У разі прямого зв’язку b — величина додатна, у разі оберненого — від’ємна.
Подаючи у як функцію х, тим самим абстрагуються від множинності причин, штучно спрощуючи механізм формування варіації у. Аналіз причинних комплексів здійснюється за допомогою множинної регресії.
Різні явища по-різному реагують на зміну факторів. Для того щоб відобразити характерні особливості зв’язку конкретних явищ, статистика використовує різні за функціональним видом регресійні рівняння. Якщо зі зміною фактора х результат у змінюється більш-менш рівномірно, такий зв’язок описується лінійною функцією Y = a + bx. Коли йдеться про нерівномірне співвідношення варіацій взаємозв’язаних ознак (наприклад, коли прирости значень у зі зміною х прискорені чи сповільнені або напрям зв’язку змінюється), застосовують нелінійні регресії, зокрема:
степеневу
;
гіперболічну
;
параболічну
тощо.
Вибір та обґрунтування функціонального виду регресії ґрунтується на теоретичному аналізі суті зв’язку. Нехай вивчається зв’язок між урожайністю та кількістю опадів. Надто мала і надто велика кількість опадів спричинюють зниження врожайності, максимальний її рівень можливий за умови оптимальної кількості опадів, тобто зі збільшенням факторної ознаки (опади) урожайність спершу зростає, а потім зменшується. Залежність такого роду описується параболою Y = a + bx + cx2.
Вивчаючи
зв’язок між собівартістю у
та обсягом продукції х,
використовують рівняння гіперболи
,
де а
— пропорційні витрати на одиницю
продукції, b
— постійні витрати на весь випуск.
Зауважимо, що теоретичний аналіз суті зв’язку, хоча й дуже важливий, лише окреслює особливості форми регресії і не може точно визначити її функціонального виду. До того ж у конкретних умовах простору і часу межі варіації взаємозв’язаних ознак х і у значно вужчі за теоретично можливі. І якщо кривина регресії невелика, то в межах фактичної варіації ознак зв’язок між ними досить точно описується лінійною функцією. Цим значною мірою пояснюється широке застосування лінійних рівнянь регресії:
.
Параметр b (коефіцієнт регресії) — величина іменована, має розмірність результативної ознаки і розглядається як ефект впливу x на y. Параметр a — вільний член рівняння регресії, це значення y при x = 0. Якщо межі варіації x не містять нуля, то цей параметр має лише розрахункове значення.
Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого — мінімізація суми квадратів відхилень емпіричних значень y від теоретичних Y:
.
Математично доведено, що значення параметрів a та b, при яких мінімізується сума квадратів відхилень, визначаються із системи нормальних рівнянь:
,
.
Розв’язавши цю систему, знаходимо такі значення параметрів:
,
.
Розглянемо порядок обчислення параметрів лінійної регресії на прикладі зв’язку між урожайністю зернових і кількістю внесених добрив (у центнерах діючої поживної речовини — д. р.). Значення взаємозв’язаних ознак та необхідні для розрахунку параметрів величини наведено в табл. 7.3.
=
12;
= 224;
=
342,8;
= 18,68;
=
12 : 8 = 1,5;
= 224 : 8 = 28.
Таблиця 7.3
