Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
metodichni_vkazivki_do_vikonannya_laboratornikh...docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
5.73 Mб
Скачать

Лабораторна робота №5

Тема: Побудова та графічне зображення інтервального варіаційного ряду розподілу одиниць сукупності за ознакою «Середньорічна вартість основних виробничих фондів»

Мета: Навчитися будувати інтервальний ряд розподілу, гістограми і кумуляти

Завдання

1. Побудова інтервального ряду розподілу одиниць вибіркової сукупності за ознакою Середньорічна вартість основних виробничих фондів.

2. Побудова гістограми і кумуляти сформованого інтервального ряду.

Теоретичні відомості

В умовах комп'ютерної обробки статистичних даних зазвичай використовують ті чи інші стандартні процедури угруповання за кількісними ознаками. Один з варіантів такого стандарту дає формула Г. Стерджесса для визначення величини інтервалу:

k = 1+3,322 lg n, (1)

де n - число одиниць сукупності. Величина інтервалу h визначається за формулою

h = , (2)

де xmax і xmin - відповідно максимальне і мінімальне значення досліджуваного ознаки. При дробовому значенні k береться найближче до нього ціле.

Побудова ряду розподілу завершується підрахунком чисельності одиниць у кожній групі - частоти групи. Іноді розподіл характеризують за допомогою накопичених частот або ж використовують частости і накопичені частості. Частости зазвичай застосовують для невеликих за обсягом сукупностей. Крім того, вони дозволяють порівнювати розподілу по одному і тому ж ознакою в різних за чисельністю совокупностях.

Нижче приведено табличне представлення інтервального ряду розподілу для демонстраційного прикладу.

Інтервальний ряд розподілення підприємств по середньорічній вартості основних виробничих фондів

Групи підприємств по середньорічній вартості основних фондів

Число підприємств в групі

Накопичена частість   групи, %

94 - 134,8

3

10,00

134,8 - 175,6

6

30,00

175,6 - 216,4

11

66,67

216,4 - 257,2

6

86,67

257,2 - 298

4

100,00

Всього

30

Для наочного уявлення інтервальних рядів розподілу використовують їх графічне зображення у вигляді гістограми і кумуляти.

Гістограма - столбиковая діаграма, для побудови якої на осі абсцис відкладають відрізки, рівні величині інтервалів варіаційного ряду. На відрізках будують прямокутники, висота яких в прийнятому масштабі по осі ординат відповідає частотам (або частості). Чим більша кількість інтервалів має ряд, тим більше зазубрені буде гістограма, чим менша - тим більше «гладкою» вона виглядає, однак при цьому можуть Крадуче характерні риси розподілу і прірва деякі його подробиці.

Для демонстраційного прикладу гістограма і кумулята наведеного вище інтервального ряду розподілу дано на рис. 5.1.

Рис. 5.1. Гістограма и кумулята інтервального ряду розподілення для демонстраційного прикладу.

Форма гістограми та її характеристики несуть наочну інформацію про розподіл одиниць сукупності по досліджуваному ознакою. Багато висновків і методи статистики базуються на використанні значень описових параметрів розподілу, особливо параметрів, що характеризують центр розподілу ( , Mo, Me) і розсіювання значень ознаки щодо центру ( , As, Ek).

Рис. 5.2. Гістограма розподілення середньої заробітной плати по підприємствам регіону, грн.

Ці параметри можна не тільки кількісно оцінити по гистограмме, але і відобразити з візуально, «побачити» їх. За формою гістограми можна встановити і характер закономірності розподілу, тобто тип функції, що описує розподіл. Так, зіставляючи форму гістограми на мал.9 з накладеною на неї кривої нормального розподілу, легко бачити істотну розбіжність між емпіричним і нормальним розподілом. Форма гістограми на рис.8, навпаки, дає підставу припускати, що розподіл емпіричних даних близько до нормального (спостерігається незначна асиметрія).

Побудова інтервальних варіаційних рядів розподілу з використанням засобів MS Excel можна здійснити різними способами - за допомогою інструменту Зведені таблиці або ж застосовуючи інструмент Гістограма надбудови Пакет аналізу. У справжньому завданні розбиття одиниць сукупності на інтервали (групи) здійснюватиметься за допомогою засобів інструменту Гістограма.

1.Особливості побудови інтервальних варіаційних рядів розподілу засобами інструменту Гістограма

  1. В надбудові Excel Пакет аналізу інструмент Гістограма використовується для генерації інтервального варіаційного ряду з рівними по величині інтервалами, а також для побудови гістограми і кумуляти сформованого ряду розподілу.

Інструмент Гістограма виробляє такі дії:

  • розраховує число інтервалів за формулою Г.Стерджесса (17);

  • визначає величину інтервалу h за формулою

(3)

  • визначає нижні межі інтервалів;

  • формує інтервальний варіаційний ряд відповідно до величинами {k}, h;

  • розраховує частоти і накопичені частості інтервалів, визначаючи число влучень даних в сформовані інтервали;

  • будує Стовпчикові діаграму частот (яка може бути перетворена в гистограмму) і кумуляту накопичених частостей для отриманого ряду розподілу;

  • генерує для варіаційного ряду вихідну таблицю в форматі (4):

Кишеня

Частота

Інтегральний %

……………..

…………….

………………………..

(4)

Ще

0

100%

  1. Між термінологією генерується в режимі Гістограма вихідний таблиці і термінами, прийнятими для варіаційних рядів, є розбіжності. Узгодження термінології наводиться в табл. 5.1.

Таблиця 5.1

Статистична інтерпретація термінології інструмента Гістограма

Термін інструменту Гістограма

Термін, прийнятий в статистиці

Кишеня

Інтервали варіаційного ряду

Інтервал кишень

Діапазон комірок, зберігающіх в зростаючому порядку верхні межі інтервалів

Інтегральний відсоток

Накопичена частость, виражена у відсотках

  1. Інструмент Гістограма має два режими роботи:

  • режим автоматичного формування інтервалів варіаційного ряду, що мають рівну величину h;

  • режим формування інтервалів ряду відповідно до меж, заданими користувачем. Якщо при цьому задані інтервали будуть не рівні між собою, то в згенерованої столбиковой діаграмі частоти потрапляння в інтервал не будуть зв'язані з розміром інтервалу, що не дозволить правильно оцінити характер розподілу одиниць досліджуваної сукупності.

2.Завдання керуючої інформації вдіалоговому вікні інструменту Гістограма

Запуск інструменту Гістограма здійснюється наступною послідовністю дій:

Сервіс => Аналіз даних => Гистограмма => ОК

Рис. 5.3. Діалогове вікно інструменту Гістограма

У діалоговому вікні інструменту Гістограма задаються наступні параметри.

1.Поле Вхідний інтервал - вводиться посилання на діапазон комірок, що містять значення аналізованого ознаки.

2. Інтервал кишень (необов'язковий параметр) - вводиться посилання на діапазон комірок, в яких задаються верхні межі інтервалів. Якщо такий діапазон не вказаний, Excel здійснює розрахунок нижніх меж інтервалів автоматично.

3. Прапорець позначки не активізується.

4. Поле Вихідний інтервал - вводиться посилання на комірку заголовка першого шпальти формованої таблиці інтервального варіаційного ряду.

5. Перемикач Новий робочий лист / Нова робоча книга - відкриває Новий робочий лист / Нову робочу книгу.

6. Прапорець Парето (отсортированная гістограма) - встановлюється в активний стан при необхідності представити дані в порядку убування частоти. Якщо прапорець знятий, то дані в вихідному діапазоні будуть приведені в порядку проходження інтервалів.

7. Прапорець Інтегральний відсоток - встановлюється в активний стан, якщо необхідно розрахувати накопичені частості (виражені в процентах) і побудувати графік кумуляти.

8. Прапорець Висновок графіка - встановлюється в активний стан при необхідності автоматичного побудови столбиковой діаграми.

3.Етапи побудови інтервального ряду розподілу з використанням двох режимів інструмента Гістограма.

Для побудови інтервального варіаційного ряду необхідно в діалоговому вікні інструменту Гістограма задати верхні межі інтервалів. Оскільки вони невідомі, для їх знаходження можна скористатися режимом автоматичного розрахунку кордонів інтервалів (п. 1.3). Однак у цьому режимі в кишенях генерируемой таблиці видаються нижні межі інтервалів. Для отримання на їх основі верхніх меж необхідно виконати дві дії:

1) виключити з кишень згенерованої таблиці нижню межу першого інтервалу xmin;

2) додати кишеню з верхньою межею хmax останнього інтервалу (значення хmax мається на табл.3 - Описові статистики).

Для демонстраційного прикладу таке перетворення приведено на рис. 5.4:

Таблиця 6

Таблиця 6

90

Кишеня

90

Кишеня

91

94,0

91

92

134,8

Перетвориться у

92

134,8

93

175,6

93

175,6

94

216,4

94

216,4

95

257,2

95

257,2

96

Ще

96

298

а) первинна

б) кінцева

Рис. 5.4. Схема переходу від нижніх меж інтервалів до верхніх

Побудова інтервального ряду з використанням описаного прийому переходу від нижніх меж до верхніх здійснюється в два етапи:

Етап 1. Застосовується режим автоматичного розрахунку кордонів інтервалів.

Етап 2. Застосовується режим формування ряду по заданим верхнім межам інтервалів (п. 1.3).

Для виконання цього етапу необхідно знову звернутися до інструменту Гістограма, задавши в діалоговому вікні наступні параметри: Вхідний інтервал, Інтервал кишень, Вихідний інтервал, Інтегральний відсоток, Висновок графіка.

Вихідна таблиця містить:

  • межі інтервалів - в графі з ім'ям «Карман»;

  • частоти інтервалів - у другій графі;

  • накопичені частості - в графі з ім'ям «Інтегральний%».

Для демонстраційного прикладу вихідна таблиця має такий вигляд:

A

B

C

99

Таблиця 7-ДП

100

Інтервальний ряд розподілення підприємств по вартості основних виробничих фондів

101

Кишеня

Частота

Інтегральний %

102

134,8

3

10,00%

103

175,6

6

30,00%

104

216,4

11

66,67%

104

257,2

6

86,67%

106

298

4

100,00%

107

Ще

0

100%

4.Пріведенние вихідний таблиці і діаграми до виду, прийнятому в статистиці

1. Згенерувати Гістограмою вихідну таблицю (табл.7) слід привести до вигляду, прийнятого в статистиці, враховуючи узгодження термінології, дане в табл.4-М. Для демонстраційного прикладу Excel-формат результативною таблиці виглядає наступним чином.

A

B

C

99

Таблиця

100

Інтервальний ряд розподілення підприємств по вартості основних виробничих фондів

101

Групи підприємств по середньорічній вартості основних фондів

Число підприємств

у групі

Накопичена частість

групи, %

102

94 - 134,8

3

10,005

103

134,8 - 175,6

6

30,00%

104

175,6 - 216,4

11

66,67%

104

216,4 - 257,2

6

86,67%

106

257,2 - 298

4

100,00%

107

108

Всього

30

 

Для переходу від табл.7 до результативної таблиці необхідно провести вручну наступні перетворення:

• замінити назви стовпців;

• видалити рядок "Ще";

• межі інтервалів привести до формату "нижня межа - верхня межа" (для першого інтервалу нижня межа - це xmin з табл.3-Описові статистики);

• додати і заповнити підсумковий рядок.

2. В якості вихідного графіка інтервального ряду інструмент Гістограма будує Стовпчикові діаграму з нанесеною на її полі кумуляти. Для перетворення столбиковой діаграми в гистограмму необхідно зменшити ширину зазору між стовпцями до 0, скориставшись відповідним засобом інструменту Майстер діаграм.

Отриману гистограмму слід перемістити в більш зручне для аналізу місце на робочому листі Excel, розташувавши її слідом за результативною таблицею. Масштаб графіка гістограми повинен відповідати правилу "золотого перетину", для чого ширина і висота гістограми встановлюється в пропорції 1: 0,62.

5.Розташування даних на робочому аркуші Excel

Вихідні дані і розраховуються характеристики ряду розподілу розташовуються в чотирьох таблицях робочого файлу персональної папки студента відповідно до таблиці.

Алгоритми виконання ЛР №6

Виконання завдання здійснюється в три етапи:

1. Побудова проміжної таблиці.

2. Генерація вихідний таблиці і графіків.

3. Приведення вихідний таблиці і діаграми до виду, прийнятому в статистиці.

Етап 1. Побудова проміжної таблиці.

Алгоритм 1.1. Розрахунок нижніх меж інтервалів

1. Сервіс => Аналіз даних => Гистограмма => ОК;

2. Вхідний інтервал <= діапазон комірок, виділений згідно табл. 5-М для стовпця значень першого ознаки;

!!! Увага. Тут можливий помилковий захоплення мишею стовпця другої ознаки. Необхідно проконтролювати правильність завдання вхідних даних!

3. Інтервал кишень залишити незаповненим;

4. Вихідний інтервал <= адреса заголовка першого шпальти первинної проміжної табл.6 (див. Табл.5-М). 5. OK;

Алгоритм 1.2. Перехід від нижніх меж до верхніх

1. Виділити курсором верхню ліву комірку табл.6 і натиснути клавішу [Delete];

2. Ввести в комірку з ім'ям "Ще" значення хmax першого ознаки з табл.3-Описові статистики.

Етап 2. Генерація вихідний таблиці і графіків

Алгоритм 2.1. Побудова вихідний таблиці, столбиковой діаграми і кумуляти.

1. Сервіс => Аналіз даних => Гистограмма => ОК;

2. Вхідний інтервал <= діапазон комірок, виділений згідно табл. 5-М для стовпця значень першого ознаки;

!!! Увага! Тут можливий помилковий захоплення мишею стовпця другої ознаки. Необхідно проконтролювати правильність завдання вхідних даних!

3. Інтервал кишень <= діапазон кишень підсумкової проміжної табл.6 з верхніми межами (див. Табл.5-М);

4. Вихідний інтервал <= адреса заголовка першого шпальти вихідний табл.7 (див. Табл.5-М);

5. Інтегральний відсоток - Активізувати;

6. Висновок графіка - Активізувати;

7. ОК;

8. При появі повідомлення про накладення даних - ОК.

Етап 3. Приведення вихідний таблиці і діаграми до виду, прийнятому в статистиці.

Алгоритм 3.1. Перетворення вихідний таблиці в результативну.

1. Замінити назви стовпців відповідно до таблиці

Назва стовпчика у вихідній таблиці

Назва стовпчика у результативній таблиці

Кишеня

Групи підпрємств по вартості основних фондів

Частота

Число підприємств у групи

Інтегральний %

Накопичена частість групи

2.Рядки першого шпальти привести до виду «нижня межа інтервалу - верхня межа інтервалу», враховуючи збіг верхніх меж попереднього інтервалу з нижньою межею наступного інтервалу;

3. Рядок з ім'ям «Ще» виділити мишею і очистити, натиснувши клавішу [Delete];

4. Додати і заповнити рядок з ім'ям «Разом».

Алгоритм 3.2. Перетворення столбиковой діаграми в гистограмму.

1. Здійснивши «захоплення мишею», перемістити графік, розташувавши його слідом за табл.7 згідно адресації, зазначеної в табл.5-М;

2. Виключити зазори, виконавши наступні дії:

2.1. Натиснути праву кнопку миші на одному з стовпчиків діаграми .;

2.2. Формат рядів даних => Параметри;

2.3. Ширина зазору <= 0; 2.4. ОК;

3. Використовуючи "захоплення мишею" за кут поля графіка, встановити співвідношення ширини і висоти фігури гістограми в пропорції 1: 0,62. !!! Увага! Тут можлива помилкова установка зазначеної пропорції для розмірів поля графіка, а не для самої геометричної фігури гістограми. Необхідно проконтролювати правильність установки пропорції ширини і висоти фігури гістограми.

3. Заключний етап

  1. Аналіз узагальнюючих показників описової статистики

На підставі розрахованих значень показників описової статистики можна не тільки отримати інформацію про середні величини, ступеня варіації і особливостях форми розподілу одиниць сукупності, але і зробити висновки про інших статистичних характеристиках і властивостях сукупності, про внутрішній зв'язок між одиницями сукупності.

1.1. Ступінь коливання ознаки визначається за значенням коефіцієнта варіації V, виходячи з оціночної шкали (6). Показник V використовується і для порівняльної оцінки варіації в різних рядах розподілів.

1.2. Однорідність сукупності для нормального і близьких до нормального розподілів встановлюється за умовою (7). Чим однорідніше яка вивчалася сукупність, тим надійніше отримана середня. .

1.3. Для оцінки надійності (типовості) середньої величини можна скористатися значенням показника варіації, V. Якщо його значення невелике, то індивідуальні значення ознаки xi мало відрізняються один від одного, одиниці спостереження кількісно однорідні і, отже, середня арифметична величина є надійною характеристикою даної сукупності. Якщо ж оцінка V. досить висока (перевищує 40%), тобто спостерігається значне розходження між значеннями xi, то середня буде ненадійною характеристикою сукупності і її практичне застосування стає проблематичним.

1.4. Зіставлення середніх відхилень - квадратического  і лінійного дозволяє зробити висновок про стійкість індивідуальних значень ознаки, тобто про відсутність серед них «аномальних» варіантів значень.

В умовах симетричного і нормального, а також близьких до них розподілів між показниками  і мають місце рівності 1,25 , 0,8, тому відношення показників і  може служити індикатором стійкості даних: якщо >0,8, то значення ознаки нестійкі, в них маються «аномальні» викиди. Отже, незважаючи на візуальне виявлення та виключення нетипових одиниць спостережень при виконанні Завдання 1, деякі аномалії в первинних даних продовжують зберігатися. В цьому випадку їх слід виявити (наприклад, шляхом пошуку значень, що виходять за межі ( ) і розглядати в якості можливих «кандидатів» на виключення з вибірки.

1.5.За значеннями показників і  можна визначити межі діапазонів розсіювання значень ознаки щодо середньої, тобто встановити, яка частка значень ознаки потрапляє в той чи інший діапазон відхилень від.

Згідно ймовірнісної теоремі П.Л.Чебишева слід очікувати, що незалежно від форми розподілу 75% значень ознаки перебуватимуть в діапазоні ( ), а 89% значень - в діапазоні ( ).

В нормально розподілених і близьких до них рядах імовірнісні оцінки діапазонів розсіювання значень ознаки такі:

68,3% увійде в діапазон ( );

95,4% потрапить в діапазон ( ); (22)

99,7% з'явиться в діапазон ( )

Співвідношення (22) відомо як правило «трьох сигм».

Для вибіркової сукупності значення та σn розраховані (табл. 3, табл.5) і є точними, тому, ґрунтуючись на правилі «трьох сигм», можна точно оцінити кордони всіх трьох діапазонів розсіювання ознаки і визначити, скільки значень xi потрапляє в кожен з діапазонів .

У разі генеральної сукупності точно відома тільки величина σn (табл. 3), а для середньої розраховані лише граничні помилки вибірки (табл.3, табл.4), тому для генеральної сукупності оцінки розсіювання значень ознаки по трьом діапазонам є прогнозними і зазвичай задаються в формі (22) з конкретним числовим значенням параметра σn.

1.6. Враховуючи правило «трьох сигм», в статистичній практиці величину 3 вважають в умовах нормального і близьких до нього розподілів максимально допустимої помилкою спостереження і відкидають результати спостережень, для яких |xi - |>3.

1.7. Для нормального розподілу справедливо рівність R = 6.

В умовах близькості розподілу одиниць генеральної сукупності до нормального це співвідношення використовується для прогнозної оцінки розмаху варіації ознаки у генеральній сукупності.