Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sis_an_pract.doc
Скачиваний:
14
Добавлен:
24.04.2019
Размер:
2.54 Mб
Скачать

Лабораторна робота 2 оцінювання параметрів генеральної сукупності та вибірки. Виконання в пакеті statistica 6.0.

Статистичне порівняння оцінок

Не завжди вдається аналітично обчислити дисперсію оцінки. Як експериментально визначити, якою з оцінок користатися? За однією вибіркою не можна судити про розкид значень оцінки, оскільки значення лише одне; необхідно мати кілька вибірок, наприклад, k = 20, (чи хоча б 5 – 10), оцінити розкид значень для кожної оцінки і віддати перевагу тій оцінці (тому способу оцінювання), для якої розкид найменший. Якщо ж вибірка лише одна, то можна (якщо п досить велике) розбити її випадковим чином на кілька вибірок, і за ними порівнювати якість оцінок.

Для прикладу, сформуємо k = 20 вибірок обсягу п = 10 і визначимо значення оцінок а12, а3 на кожній вибірці.

Запустимо пакет STATISTICA for Windows, вибравши в меню Basic Statistic / Tables and Banners.

Створення таблиці потрібних розмірів

З пункту меню File виберемо команду New Data;

вкажемо ім'я файла для збереження майбутньої інформації ОК.

Бачимо на екрані таблицю 10×10, де кожен стовпець відведено під змінну (назву якої винесено в заголовок стовпця).

Перетворимо цю таблицю до розмірів 20×10 (20 вибірок по 10 спостережень): кнопка Vars (змінні), чи через меню Edite Variables, і у новому меню виберемо команду Add (додати).

На екрані з'явиться запит про кількість додаткових змінних (стовпців) і про те, куди їх помістити.

Додамо 10 змінних, проставивши 10 у поле Number... to add (набором на клавіатурі чи кнопками праворуч від поля; у поле Insert after вкажемо ім'я змінної Var10, після якої будуть вставлені в матрицю нові стовпці; потім ОК.

Тепер можна переконатися (переглядом таблиці), що в ній 20 стовпців; крім того, розміри таблиці (у даному випадку, 20v * 10с) завжди зазначено у її заголовку. Кількість рядків не змінюємо: 10. Зауважимо, що коли кількість рядків (case) чи стовпців (variable) у таблиці перевищує необхідну, можна таблицю не зменшувати.

Генерація вибірок

Послідовність дій:

клавіша VarsAll specs (специфікація усіх) – з'являється вікно-таблиця, у першому стовпці якої є назви змінних (varl, var2,..., var20), а в четвертому (Long Name) - функція розрахунку (рис. 2.1)

Рис. 2.1. Специфікація змінних

виділимо першу клітинку цього стовпця і введемо

=Rnd(10) – генерація випадкових чисел, рівномірно розподілених на відрізку [0;10].

Скопіюємо цей запис у буфер обміну: Edit Copy (чи кнопкою Copy), а потім перенесемо її в Інші клітинки (з 2 по 20). Закриємо вікно.

Виконаємо зроблені призначення:

кнопка х = ? – All variablesOK.

Збережемо 2 – 3 перші вибірки-стовпця для того, щоб надалі роздрукувати:

виділяємо 2-3 стовпці – File – Export Data – формат Text – File name: Samples (наприклад).

Визначення значень оцінок а1, а2 і а3 за 20 вибірками

В изначимо статистики, за якими обчислюватимемо оцінки: виділимо всю матрицю, потім проведемо три такі операції (рис. 2.2):

Рис. 2.2. Знаходження оцінок основних параметрів.

Edit – Block Stats/Columns – Sums (Max's, Medians)

Можемо це зробити інакше: права клавіша миші – Block Stats/Columns (блок статистик по стовпчиках) – Sums, (Max's, Medians).

У нижній частині таблиці з'являються три рядки з потрібними статистиками. Для нових рядків уведемо зручніші позначення:

кнопка CasesNames.

Транспонуємо нашу матрицю, що тепер має розмір 20v×13c, у матрицю 13v×20c (щоб робити дії зі стовпцями):

Edit – Transponse – Data File.

Додамо в матрицю 3 стовпці (з 14 по 16 для значень оцінок) Vars – Add – Number of vars: 3 – after: 13 і введемо формулу для обчислення значення оцінки а1:

виділимо 1-й новий стовпець Newvar1, натиснемо Vars – Current Specs (специфікація) –Name: A1 – Long name: = 2/10*V11. Аналогічно введемо формули для обчислення значень оцінок а2 І а3:

для а2: = 11/10*V12, для а3: = 2*V13.

Отримані результати (стовпці а1, а2, а3) значень трьох оцінок на 20 вибірках збережемо: виділимо а1, а2, а3 FileExport Dataформат Textвкажемо, куди зберегти і з яким ім'ям.

Характеристики розсіювання оцінок

Виділимо стовпці а1, а2, а3 EditBlock Stats/ColumnSD's (стандартне відхилення), потім аналогічно: Min's, Max's.

Порівняння розмахів w і стандартних відхилень Sa для трьох оцінок показує, що оцінка а21,.. .,Хп) найточніша, а оцінка а3г,... ,Хп) найменш точна.

Порівняння оцінок а2 і а3 графічно

Graphs – Stats 2D Graphs – Line Plots (Variables) у вікні 2D Line Plots: Variables: А2 – A3,

Graphs Type : Multiple, Fit (підбір розподілу) ; off (виключити),

Cases: 1 – 20 – OK.

З графіка (рис. 2.3) видно, що значення оцінок розташовані в околі 10 і що оцінка а2 має розсіювання менше, ніж а3.

Оцінювання за вибірками обсягу п=40 і п=160

Повторимо попередні процедури для п = 40 і п = 160. Порівняння Sa(n) трьох оцінок графічно для значень п = 10, 40, 160:

створимо 4 нові змінні довжини 3:

п : зі значеннями 10, 40, 160; Sa1, Sa2, Sa3: зі значеннями стандартного відхилення для трьох оцінок.

Побудуємо графіки Sa(n) :

виділимо змінні Sal, Sa2, Sa3 – Graphs Custom Graphs 2D Graphs введемо для Plot1 X : N, Y : Sa1, для Plot2 X : N, Y: Sa2, для Plot3 X : N, Y: Sa3 – OK.

Спостерігаємо три криві Sa(n) як функції п (рис. 2.4).

Рис. 2.3. Порівняння оцінок.

Рис. 2.3. Порівняння оцінок за стандартним відхиленням.

Очевидно, що оцінка а21,..., Хп) найточніша, а найменш точна – оцінка а31,.. .,Хп).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]