Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курсова ПОВНІСТЮ.doc
Скачиваний:
4
Добавлен:
29.08.2019
Размер:
500.74 Кб
Скачать

1.3 Послідовність та мета дослідження однорідності статистичної сукупності

Під одноякісністю, або однорідністю, розуміють підпорядкованість елементів, що складають сукупність, загальному закону розвитку або їх однотипність (наприклад, інформація про сукупність одиниць господарств, малих підприємств; про сукупність одиниць виробленої ними продукції і т.д.)

Однорідність сукупності — передумова використання інших статистичних методів (середніх величин, регресійного аналізу тощо). Однорідними вважаються такі сукупності, елементи яких мають спільні властивості і належать до одного типу, класу. При цьому однорідність означає не повну тотожність властивостей елементів, а лише наявність у них спільного в істотному, головному. [18]

Найважливішою властивістю статистичної сукупності є варіація - кількісна зміна значення статистичної ознаки при переході від одного її елементу до іншого. [19] Термін "варіація" має латинське походження - variatio, що означає відмінність, зміну, коливання. Вивчення варіації в статистичній практиці дозволяє встановити залежність між зміною, яка відбувається в досліджуваній ознаці, і тими чинниками, які викликають дану зміну. Варіація виникає під впливом певного комплексу умов і причин. Статистика не займається виявленням і з'ясуванням цих причин. Цим займаються спеціальні економічні дисципліни, а статистика кількісно оцінює дію кожної причини на варіацію конкретної ознаки, що дозволяє враховувати вказану дію при ухваленні управлінських рішень різного рівня.

Для вимірювання варіації ознаки використовують як абсолютні, так і відносні показники.

До абсолютних показників варіації відносять: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення, дисперсію. До відносних показників варіації відносять: коефіцієнт осциляції, лінійний коефіцієнт варіації, відносне лінійне відхилення і ін.

Розмах варіації R. Це найдоступніший по простоті розрахунку абсолютний показник, який визначається як різниця між найбільшим (Хmax) і найменшим (Хmin) значеннями ознаки у одиниць даної сукупності:

, де формула (1)

Хmax – найбільше значення ознаки у одиниці сукупності;

Хmin – найменше значення ознаки у одиниці сукупності.

Розмах варіації (розмах коливань) - важливий показник тієї ознаки, що коливається, але він дає можливість побачити тільки крайні відхилення, що обмежує сферу його застосування. Для точнішої характеристики варіації ознаки на основі обліку тієї, що його коливається використовуються інші показники.[11]

Середнє лінійне відхилення (d), яке обчислюють для того, щоб врахувати відмінності всіх одиниць досліджуваної сукупності. Ця величина визначається як середня арифметична з абсолютних значень відхилень від середньої. Оскільки сума відхилень значень ознаки від середньої величини дорівнює нулю, то всі відхилення беруться по модулю.

Наведемо формулу визначення середнього лінійного відхилення (просте):

, де формула (2)

Хі – значення ознаки одиниці сукупності;

– середнє значення одиниці сукупності;

n – кількість одиниць сукупності.

Зважене середнє лінійне відхилення визначається за наступною формулою:

формула (3)

При використанні показника середнього лінійного відхилення виникають певні незручності, пов'язані з тим, що доводиться мати справу не тільки з позитивними, але і з негативними величинами, що спонукало шукати інші способи оцінки варіації, щоб мати справу тільки з позитивними величинами. У такий спосіб стало піднесення всіх відхилень до другого ступеня. Узагальнюючі показники, знайдені з використанням других ступенів відхилень, набули дуже широкого поширення. До таких показників відносяться середнє квадратичне відхилення і середнє квадратичне відхилення в квадраті, яке називають дисперсією.

Наведемо формули обчислення середніх квадратичних відхилень:

  • середня квадратична проста:

формула (4)

  • середня квадратична зважена:

формула (5)

Дисперсія є не що інше, як середній квадрат відхилень індивідуальних значень ознаки від його середньої величини.

Формула дисперсії простої :

формула (6)

Формула зваженої дисперсії:

формула (7)

Окрім показників варіації, виражених в абсолютних величинах, в статистичному дослідженні використовуються показники варіації (V), виражені у відносних величинах, особливо для цілей порівняння тієї, що коливається за різними ознаками однієї і тієї ж сукупності, або для порівняння тієї, що коливається за одною і тією ж ознакою в декількох сукупностях.

Дані показники розраховуються як відношення розмаху варіації до середньої величини ознаки (коефіцієнт осциляції), відношення середнього лінійного відхилення до середньої величини ознаки (лінійний коефіцієнт варіації), відношення середнього квадратичного відхилення до середньої величини ознаки (коефіцієнт варіації) і, як правило, виражаються у відсотках.

Формули розрахунку відносних показників варіації [13]:

формула (8)

формула (9)

формула (10)

Аналіз однорідності статистичної сукупності доцільно проводити в наступній послідовності:

  1. Визначення ступеня однорідності всієї сукупності поодинці або декільком істотним ознакам;

  2. Визначення і аналіз аномальних спостережень;

  3. Вибір оптимального варіанту виділення однорідних сукупностей.

Будь-яка досліджувана сукупність разом зі значеннями ознак, які характерні для досліджуваної сукупності, може містити і значення ознак не характерних для основної сукупності. Такі значення різко виділяються, тому використання методології статистичного аналізу даної сукупності без попереднього аналізу і вивчення аномальних спостережень приводить до серйозних помилок.

Причини появи в сукупності аномальних спостережень умовно підрозділяють таким чином:

- зовнішні (які виникають в результаті технічних помилок);

- внутрішні (які об'єктивно існують).

Такі спостереження для дослідника представляють особливий інтерес, оскільки можуть містити за рахунок впливу неврахованих чинників особливу інформацію. На практиці залежно від умов, місця і часу вплив одних чинників в кожен конкретний момент або проміжок часу значніший, ніж інших.

Вибір методу виявлення, аналізу аномальних спостережень визначається об'ємом сукупності, характером досліджуваних процесів і завдань (одновимірних або багатовимірних).

При реалізації одновимірних завдань при аналізі динамічної і статистичної інформації найбільш широкого поширення набув метод виявлення аномальних спостережень, заснований на визначенні q-статистики:

, де формула (11)

yt - окремі рівні ряду;

у - середній рівень ряду;

y – середнє квадратичне відхилення значень ряду від їх середнього рівня.

Якщо для розрахункового значення виконується умова qt  qtk p (p) із заздалегідь заданим рівнем вірогідності, то дані спостереження вважаються аномальними і після логіко-економічного аналізу причин помилок аномальності підлягають заміні скорегованим значенням і не підлягають корегуванню.

Корегування здійснюється за наступною схемою [11]:

1) Розраховується нове значення рівня ряду:

yi (1) = qkp (p)y + y формула (12)

2) замінюється на .

3) Визначаються нові характеристики ряд з : та .

4) yi = qkp (p)y + y формула (13)

5) Перевіряється аномальність значення yi :

yi - yi  , де формула (14)

 - заданий рівень точності визначення yi .

Якщо дана умова виконується, то значення yi є скорегованим, не аномальним значенням, займає місце yi (1) у ряду і аналізу піддається yi (2) . Якщо умова не виконується, то рекомендується розрахувати yi(2) і перевірити на аномальність. Процес корегування носить ітераційний характер.

Доцільність виключення аномальних спостережень із сукупності, що вивчається, реалізується широким використанням методу угрупувань. За допомогою методу угрупування явища, що вивчаються, підрозділяються на найважливіші типи, характерні групи і підгрупи по істотних ознаках. За допомогою угрупувань формують якісно однорідні частини статистичної сукупності.

У прикладних дослідженнях часто виникає необхідність з'ясувати, чи розрізняються генеральні сукупності, з яких узято дві незалежні вибірки. Наприклад, треба з'ясувати, чи впливає спосіб упаковки підшипників на їх споживчі якості через рік після зберігання. Або: чи відрізняється споживча поведінка чоловіків і жінок. Якщо відрізняється - рекламні ролики і плакати треба робити окремо для чоловіків і окремо для жінок. Якщо немає - рекламна кампанія може бути єдиною.

У математико-статистичних термінах постановка завдання така: є дві вибірки x1, x2...,xm і y1, y2...,yn (тобто набори з m і п дійсних чисел), потрібно перевірити їх однорідність. Термін «однорідність» уточнюється нижче.

Протилежним поняттям є «відмінність». Можна переформулювати завдання наступним чином: потрібно перевірити, чи є відмінність між вибірками. Якщо відмінності немає, то для подальшого вивчення дві дані вибірки часто об'єднують в одну.

Наприклад, в маркетингу важливо виділити сегменти споживчого ринку. Якщо встановлена однорідність двох вибірок, то можливе об'єднання сегментів, з яких вони узяті, в один. Надалі це дозволить здійснювати по відношенню до ним однакову маркетингову політику (проводити одні і ті ж рекламні заходи і тому подібне). Якщо ж встановлена відмінність, то поведінка споживачів в двох сегментах різна, об'єднувати ці сегменти не можна, і можуть знадобитися різні маркетингові стратегії, своя для кожного з цих сегментів.[4]

Для подальшого критичного розбору використовується традиційний статистичний метод перевірки однорідності (критерій Стьюдента). Обчислюють вибіркові середні арифметичні в кожній вибірці за формулами[11]:

формула (15)

формула (16)

Потім визначають вибіркові дисперсії:

формула (17)

формула (18)

і t-критерія Стьюдента, на основі якого ухвалюють рішення:

формула (19)

По заданому рівню значущості і числу мір свободи (m+n - 2) із таблиць розподілу Стьюдента знаходять критичне значення tкр. Якщо |t|>tкр, то гіпотезу однорідності (відсутність відмінності) відхиляють, якщо ж |t|<tкр, то приймають. При односторонніх альтернативних гіпотезах замість умови |t|>tкр перевіряють, що t>tкр; цю постановку розглядати не будемо, оскільки в ній немає принципових відмінностей від обговорюваної тут.

В даному підрозділі ми розглянули таку з ознак статистичної сукупності, як однорідність статистичної сукупності. Було наведено головні властивості, принципи та методи розрахунку основних показників однорідності статистичної сукупності.

Отже, в даному розділі було розглянуто основі категорії статистики, розкрито терміни «статистична сукупність», «однорідність статистичної сукупності» та висвітлено їх основні елементи та ознаки. Також розглянуто питання послідовності та мети дослідження однорідності статистичної сукупності, в якому наведено основні визначення та формули показників варіації за допомогою яких проводиться перевірка сукупностей на однорідність.