- •До виконання лабораторних робіт з дисципліни
- •6.010104 «Професійна освіта (за профілем)»
- •Кривий Ріг – 2014
- •Завдання Для даної матриці виконати такі дії:
- •Порядок виконання роботи
- •Результат виконання роботи
- •Контрольні питання
- •Теоретичні відомості
- •Кінцевий результат виконання роботи
- •Контрольні питання
- •Лабораторна робота 3
- •Завдання
- •Теоретичні відомості
- •Порядок виконання лабораторної роботи
- •Лабораторна робота №4
- •Теоретичні відомості
- •Порядок виконання роботи
- •Лабораторна робота №5
- •Завдання
- •Теоретичні відомості
- •Лабораторна робота №6
- •Теоретичні відомості
- •Порядок виконання роботи:
- •Звіт повинен містити:
- •Запитання до роботи.
- •Лабораторна робота №8
- •Теоретичні відомості
- •Завдання
- •Варіанти завдань:
- •Контрольні питання
- •Лабораторна робота №9
- •Теоретичні відомості
- •Хід роботи
- •Завдання
Теоретичні відомості
Апріорний аналіз вихідного статистичного матеріалу (інші терміни - попередній, первинний, розвідувальний) є важливим етапом сукупності статистичного дослідження.
На цьому етапі вирішуються дві основні задачі:
критична оцінка вихідних даних з точки зору їх достовірності та наукової обгрунтованості;
виявлення типових рис і закономірностей, властивих спостережуваного явища в цілому.
Всебічна та якісна оцінка вихідних даних на етапі апріорного аналізу - це передумова отримання на наступних етапах статистичного дослідження науково обґрунтованих, логічно вивірених статистичних характеристик досліджуваного явища.
Методи апріорного аналізу включають:
узагальнення вихідних даних на основі побудови варіаційних рядів розподілу по розглянутих ознаками;
оцінку однорідності досліджуваної сукупності;
аналіз характеру розподілу одиниць сукупності по досліджуваним ознаками.
Потужні і гнучкі комп'ютерні засоби для вирішення перерахованих вище завдань надає програмна надбудова Пакет аналізу табличного процесора Microsoft Excel. Вивчення можливостей цього пакета і освоєння технології роботи з ним при проведенні апріорного статистичного аналізу сприятиме підвищенню рівня підготовки студентів у галузі комп'ютерного рішення економіко-статистичних задач.
1. Статистична сутність завдань апріорного аналізу даних
Аналіз однорідності сукупності. При проведенні статистичного дослідження основоположним вимогою до досліджуваної сукупності є її однорідність. Під однорідністю статистичної сукупності розуміється її якісна і кількісна однорідність. Якісна однорідність означає, що одиниці сукупності, характеризуясь безліччю різних властивостей і особливостей і беручи участь в різних за своєю природою процесах, в той же час в певному відношенні мають загальні властивості, загальним законом розвитку і в цьому відношенні є однокачественность, належать одному певному типу. Саме в силу їхньої подібності за ознаками, характерними для даного типу, вони й об'єднані в єдину сукупність. Поняття однорідності сукупності є відносним: одна і та ж сукупність може бути однорідною за одними ознаками і різнорідною за іншими. У разі виявлення неоднорідності досліджуваної сукупності статистика вдається до методу угруповання первинних даних з метою утворення однорідних груп. Угруповання дає можливість виділити зі складу всіх спостережуваних випадків одиниці різної якості, показати особливості явища при його розвитку в різних умовах.
Виявлення аномальних одиниць спостереження. Із завданням аналізу однорідності сукупності тісно пов'язана задача виявлення в сукупності аномальних спостережень. Статистичне вивчення сукупності без попереднього виявлення і аналізу можливих аномальних спостережень може не тільки спотворити значення узагальнюючих показників (середньої, дисперсії, середнього квадратичного відхилення та ін.), Але і привести до серйозних помилок у висновках про статистичні властивості сукупності, зроблених на основі отриманих оцінок показників. У разі виявлення аномальних спостережень правильність результатів аналізу забезпечується або винятком аномалій з вихідних даних внаслідок їх нетиповість для досліджуваної вибірки, або коригуванням їх впливу за допомогою так званої "підчищення даних", в основі якої лежать спеціальні методи робастного статистичного оцінювання (від англ. Robust - стійкий, міцний).
Побудова і аналіз варіаційних рядів розподілу. Статистичні властивості, структура (внутрішня будова) і закономірності, притаманні спостерігається сукупності, досліджуються шляхом аналізу рядів розподілу одиниць сукупності по досліджуваним ознаками. Такі ряди будуються на основі емпіричних даних (фактичних даних спостереження) і називаються емпіричними розподілами. Емпіричні розподілу представляються у вигляді дискретних або інтервальних варіаційних рядів. В дискретному варіаційному ряду варіанти значень ознаки розташовуються в порядку зростання їх величини і для кожного варіанту вказується його частота - число, що показує як часто в одиниць сукупності зустрічається даний варіант значення ознаки. Інтервальний варіаційний ряд представляє ознака у вигляді упорядкованого набору інтервалів значень ознаки із зазначенням для кожного інтервалу його частоти, що фіксує число влучень значень ознаки в даний інтервал. Кількість інтервалів і їх величина вибираються таким чином, щоб найбільш чітко могла б проявитися закономірність варіації ознаки.
Для кожного досліджуваного ознаки будується варіаційний ряд розподілу одиниць сукупності за цією ознакою і розраховуються узагальнюючі статистичні характеристики ряду - середня, мода Мо, медіана Ме, показники варіації ознаки R, , σ, σ2, Vσ і особливостей форми розподілу As, Ek. На їх основі оцінюються стійкість індивідуальних значень ознаки xi, надійність їх середнього значення, ступінь варіації ознаки, встановлюється характер (тип) закономірності зміни частот у розподілі та інші статистичні властивості розподілів.
Для візуального аналізу емпіричних розподілів використовуються їхні графічні зображення - полігони, гістограми і т.д.
Визначення типу закономірності розподілу. Важливою характеристикою варіації ознаки разом є певний порядок зміни частот ряду розподілу в залежності від зміни величини ознаки. Наприклад, зі зростанням ознаки частоти спочатку також можуть зростати, а потім, досягнувши в середині ряду своєї максимальної величини, - зменшуватися в міру подальшого зростання значень ознаки. Такий характер зміни частот простежується, зокрема, у графіку функції f (x) на мал. 1.
Рис.3.1. Крива нормального розподілу.
Чітко виражений порядок зміни частот відповідно до зміни величини ознаки називають закономірності розподілу.
У характері (типі) закономірностей розподілів відображені певні умови і причини, що впливає на варіацію ознаки: сутність явища і ті його властивості та умови протікання, які визначають колеблемость значень ознаки.
Механізм формування закономірності описується в аналітичній формі у вигляді функціональної (однозначною) залежності y = f (x) значень частот f (x) від варіантів x.
Вид функції f (x) визначає тип закономірності.
Графічне зображення залежності y = f (x) (у вигляді безперервної лінії) називають кривою розподілу, а форму цієї кривої - формою розподілу.
Знання типу закономірності розподілу (а отже, і форми кривої) необхідно насамперед для з'ясування типовості умов отримання первинного статистичного матеріалу та для забезпечення правильності виконання практичних розрахунків і прогнозів, оскільки багато з статистичних методів і прийомів вимагають при їх застосуванні підпорядкованості одиниць сукупності певної закономірності розподілу.
Як відомо з математичної статистики, всяке теоретичне розподіл характеризується тим чи іншим законом розподілу ймовірностей, що встановлює функціональну залежність y = f (x) між значеннями ознаки та їх частотами. Графічно така залежність виражається кривою певної форми, званої формою теоретичного розподілу. Математична статистика надає для моделювання емпіричних розподілів широкий спектр теоретичних розподілів - нормальне, логарифмічно нормальний, биномиальное, Пуассона, Стьюдента, Пірсона, Фішера, Шарлье та ін. Кожне розподіл має свою специфіку, свої умови виникнення і область застосування. Виходячи їх цих факторів, і вибирають для емпіричного розподілу адекватну (тобто найбільш підходящу) теоретичну модель, виражену імовірнісним законом розподілу y = f (x). При цьому функція f (x) виступає в якості наближеного опису закономірності емпіричного розподілу, визначаючи тим самим тип закономірності.
Якщо, наприклад, моделлю служить нормальний розподіл, то емпіричне розподіл наближено описується законом нормального розподілу випадкової величини (законом Гаусса)
де f (x) - щільність розподілу випадкової величини ознаки x, і σ2 - відповідно середня арифметична і дисперсія значень ознаки, π і e - математичні константи (π = 3,14; e = 2,72).
Форму теоретичної кривої можна визначити і по вигляду гістограми, використовуючи граничний перехід для згладжування зазублин стовпців гістограми (рис. 3.2).
Припущення про характер того чи іншого емпіричного розподілу - це гіпотези, а не категоричні твердження, тому вони зазвичай піддаються статистичної перевірці. Для цієї мети використовується ряд особливих критеріїв, званих критеріями згоди (Пірсона, Романовського, Колмогорова та ін.). Критерії згоди дозволяють відкинути або підтвердити правильність висунутої гіпотези про характер розподілу в емпіричному ряду і дати відповідь, чи можна прийняти для даного емпіричного розподілу модель, виражену деяким теоретичним законом розподілу.
2. Загальна методика апріорного аналізу статистичних даних
Узагальнення вихідних даних:
побудова інтервальних варіаційних рядів розподілу по кожному з розглянутих ознак на базі попереднього визначення доцільного кількості груп;
графічне зображення отриманих рядів розподілу у вигляді гістограми, полігону, кумуляти, огіви.
Аналіз однорідності сукупності:
визначення ступеня однорідності всієї сукупності загалом, а такде однорідності одиниць в групах інтервального ряду розподілу;
виявлення та аналіз аномальних спостережень.
Оцінка характеру розподілу сукупності емпіричних даних:
обчислення та аналіз показників центру розподілу і варіації ознак;
встановлення форми емпіричних розподілів, отриманих у вигляді варіаційних рядів;
перевірка гіпотези про форму розподілу на базі одного з критеріїв згоди.
Виявлення аномальних значень ознаки найбільш зручно проводити графічним методом. Для візуального аналізу розкиду одиниць сукупності можна використовувати різні типи графіків у тому числі точковий графік. По розташуванню точок на точковому графіку легко виявити значення ознаки, які різко виділяються із загальної, однорідної маси значень ознак одиниць сукупності.
У лабораторній роботі в якості вихідних даних представлені вибіркові значення двох ознак - Середньорічна вартість основних виробничих фондів і Випуск продукції. Для виявлення аномальних значень цих ознак можна побудувати графік для кожного з ознак окремо, проте аналіз спроститься, якщо використовувати діаграму розсіювання.
Діаграма розсіювання - це точковий графік, осях X та Y якого зіставлені два досліджуваних ознаки одиниць сукупності. У разі, якщо ознаки X і Y є взаємопов'язаними, діаграму розсіювання прийнято називати кореляційним полем. При побудові діаграми розсіювання по осі X слід розташувати значення ознаки
Середньорічна вартість основних виробничих фондів, а по осі Y - відповідні значення ознаки Випуск продукції.
Виявлення різко виділяються спостережень виробляється візуально, шляхом виявлення точок, віддалених від основної маси точок на істотній відстані (для демонстраційного прикладу див. рис. 3.3).
Кожен "викид" з основної маси точок означає аномальність одиниці спостереження або за ознакою X, або за ознакою Y. В обох випадках такі одиниці спостереження (підприємства) підлягають видаленню з первинних даних.
Рис. 3.3. Аномальні значення ознак на діаграмі розсіювання
