Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Pr.3.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
451.07 Кб
Скачать

3.4 Порядок виконання роботи за допомогою пакета spss

3.4.1 Моделювання оцінок на вибірках обсягу n = 10

3.4.1.1 Генерація вибірок

Сформуємо k = 20 вибірок обсягу n = 10 і визначимо оцінки â1 , â2 і â3 на кожній вибірці.

Після завантаження SPSS 10.0 і можливої відміни вікна SPSS for Windows, що пропонує питання “What would you like to do?” (Що ви збираєтесь робити?), - на екрані Untitle – SPSS data Editor (неназваний файл редактора даних) із відкритою сторінкою Data View (перегляду даних) або Variable View (перегляду змінних). Обираємо спочатку Variable View . Для формування 20-ти вибірок даних у стовпчик Name впишемо імена відповідних змінних, наприклад, x01…x20. По умовчуванню будуть заповнені і інші стовпчики, із яких головними є: Type (тип) із значенням Numeric, Width (ширина) із значенням 8 та Decimals (десяткові) із значенням 3, тобто всі змінні задані числового типу загальною шириною 8 символів із 3-а десятковими розрядами після коми. Інші типи змінних можна задати після виділення відповідного значення Numeric та натискання кнопки “…“ всередині комірки.

Для генерування даних необхідно відкрити іншу сторінку редактора, обравши Data View замість Variable View (у нижньому лівому куті екрана). Тепер стовпчики таблиці мають введені імена x01,…,x20. Задамо об’єм вибірок. Для цього відмітимо комірку 10 у першому стовпчику і введемо туди будь-яке число, наприклад, 0. У результаті, в комірці з’являється ,000, а решта комірок таблиці відмічаються комою. Таблиця з об’ємом даних n=10 заготовлена.

Заповнюємо таблицю даними:

Transform - Compute...- у вікні Compute Variable - Target Variable (вихідна змінна): x01, Numeric Expression (числовий вираз):

UNIFORM (10)

(рівномірний розподіл на відрізку [0, 10] ; цей запис беремо зі списку Function). Якщо тепер натиснути ОК, то піде виконання команди. Можна це повторити, починаючи з Transform, 19 разів (змінюючи тільки номер змінної).

Але у пакеті можна виконувати команди не тільки в діалозі, а й спеціальною мовою у вікні Syntax. У кожному діалоговому вікні є кнопка Paste, за допомогою якої одержують відповідну команду у вікні Syntax. Отже, після UNIFORM (10):

Paste - OK.

У вікні Syntax маємо текст команди

COMPUTE x01 = UNIFORM (10).

EXECUTE.

Скопіюємо 1-й рядок 19 разів, потім змінимо імена змінних на х02 ÷ х20. Виділимо весь текст і натиснемо кнопку Run (EXECUTE, запускає на виконання всі виділені команди).

Збережемо таблицю у файлі Estim10. sav на диску А.

File - Save Data - ...

Виділимо перші три вибірки (стовпця) і роздрукуємо їх:

File - Print - Selection - OK.

3.4.1.2 Визначення проміжних параметрів для обчислення оцінок

Визначимо для всіх вибірок (20 стовпчиків) величини, від яких залежать оцінки â1 , â2 , â3 . Відповідно до формул (3.1), (3.2) і (3.3) такими величинами є сума елементів вибірки (для â1 ), максимальне значення елементів вибірки (для â2 ) та медіана вибірки (для â3).

Виконуємо:

Analyze – Descriptive Statistics (описові статистики) – Frequencies (частоти) - імена змінних х01, …, х20 переносимо в правий список Variable(s). Для прискорення переносу відмітимо всі 20 змінних разом, натиснувши клавішу SHIFT і клацнувши спочатку х01, а потім х20. Далі: Statistics...- відзначимо Sum, Maximum та Median – Continue . Знімаємо прапорець Display frequency tables (Показати таблиці частот), оскільки ці таблиці не потрібні, - OK.

У вікні результатів Output з’являється таблиця, що містить рядки довжини 20 – значення Maximum, Sum та Median для усіх вибірок. Значення цих рядків потрібні для подальших розрахунків, тому треба мати їх у таблиці даних. Але переніс значень із файлу Output до таблиці даних зустрічає ускладнення:, по-перше, у таблиці даних вони мають бути представлені стовпчиками, а не рядками; по-друге, значення таблиці Statistics файлу Output мають тип String (рядки), тоді як для виконання розрахунків вони повинні мати тип Numeric. Тому спочатку міняємо рядки на стовпчики. Двічі клацнувши таблицю Statistics, вводимо її у режим редагування, натиснувши в рядку Меню клавішу Pivot (головні таблиці), вибираємо Transpose Rows and Colums (транспонування рядків і стовпчиків). Потім відкриваємо у таблиці даних сторінку Variable View, вводимо три нових змінних типу String 8 з іменами, наприклад, Maximum, Sum та Mediаn і перемикаємо сторінку на Data View. Далі по черзі переносимо ці стовпчики з файлу Output за допомогою процедури Copy – Paste, попередньо відмічаючи їх у режимі редагування таблиці Statistics (клацнути при натисненій кнопці ALT). Треба уважно контролювати процедуру переносу на відсутність пошкоджень. Наприкінці необхідно задати змінним Maximum, Sum та Median тип Numeric 8.3 (шляхом натискання кнопки … всередині відповідних клітинок String ).

Відмітимо, що подана процедура є штучним прийомом, призначеним для прискорення обчислень трьох параметрів Maximum, Sum та Median одночасно для 20-ох вибірок. У результаті, вертикальними координатами цих стовпчиків є кількість вибірок (20), а не об’єм вибірки (10), як для решти даних.

3.4.1.3 Визначення оцінок â1 , â2 та â3

Утворимо нові змінні a1, a2, a3 типу Numeric 8.3 (див. п. 3.4.1.1) і обчислимо значення оцінки â1 :

Transform - Compute - Target Var: a1, Numeric Expression: 2 Sum/10 – OK ;

оцінки â2 :

Transform - Compute - Target Var: a2, Numeric Expression: Maximum*11/10 – OK ;

оцінки â3 :

Transform – Comput .- Target Var: a3, Numeric Expression: Median*2 OK.

Оцінки â1 , â2 та â3 отримані для кожної з 20-ох вибірок, тому довжина стовпчиків

a1, a2, a3 складає також 20.

        1. Порівняння обчислених оцінок

Для графічного порівняння отриманих оцінок створимо додаткову змінну а довжиною 20 із правдивим значенням шуканого параметра розподілу, рівним 10, а також змінну n2, що містить натуральні числа 1, …, 20, яка буде використовуватись на графіку як незалежна.

Далі:

Graphs – Scatter (Розсіювання) Overlay (Накладання) – Define (Визначити) - у поле Y – X Pairs вносимо попарно: а – n2, a1 – n2, a2 – n2, a3 – n2,OK. Для забезпечення необхідної послідовності пар слід використовувати Swap Pair.

Для з’єднання точок розсіювання лініями: уводимо графік у режим редагування, двічі клацнувши по ньому, натискаємо кнопку Interpolation із зображенням зигзагу – Straight (Прямі) – Apply All (Застосувати).

Спостерігаємо по 20 значень трьох різних оцінок. З графіка видно, що оцінка â2 є найбільш точною, а оцінка â3 -найменш.

Для заповнювання частини таблиці 3.1, яка відповідає об’єму вибірки n=10, необхідно обчислити також мінімум, максимум, розмах, середнє значення та середньоквадратичне відхилення (СКВ) оцінок â1 , â2 та â3 :

Analyze – Descriptive Statistics – Frequencies ...- у поле Variable(s): a1, a2, a3 (старі імена зі списку забрати ліворуч) - у Statistics… відзначити: Std. Daviation, Range (розмах), Minimum, Maximum – Mean – Continue – OK..

Порівнюємо стандартні відхилення і розмахи різних оцінок, переконуємося, що оцінка â2 точніше інших, а â3 – найменш точна.

Наприкінці заповнюємо відповідну частину таблиці 3.1 (для n=10). Утворюємо в таблиці даних нові змінні: n із значеннями 10,40,160; Sa1, Sa2 та Sa3 – кожна з одним значенням СКВ, які тільки що внесені у таблицю 3.1 по результатах розрахунків. Ця інформація дозволить у кінці роботи побудувати графік залежності середньоквадратичних відхилень Sa1, Sa2 та Sa3 оцінок â1 , â2 та â3 від об’єму початкових вибірок n.

3.4.2 Моделювання оцінок на вибірках обсягу n = 40 та n = 160

Усі дії п. 3.4.1 повторюються двічі для n = 40 та n = 160 .

В результаті таблиця 3.1 буде заповненою повністю.

Для побудови графіка залежності середньоквадратичних відхилень Sa1, Sa2 та Sa3 оцінок â1 , â2 та â3 від об’єму початкових вибірок n виконуємо:

Graphs – Scatter (Розсіяння) Overlay (Накладання) – Define (Визначити) - у поле Y – X Pairs вносимо попарно: Sa1 – n, Sa2 – n, Sa3 – n, OK.

Для з’єднання точок розсіювання лініями: уводимо графік у режим редагування, двічі клацнувши по ньому, натискаємо кнопку Interpolation із зображенням зигзагу – Straight (Прямі) – Apply All (Застосувати).

Аналіз отриманих даних показує:

  • Усі три оцінки є змістовними, тобто їх СКВ прямують до нуля при збільшенні об’єму вибірки n;

  • Усі три оцінки є незміщеними, оскільки при збільшенні n вони наближаються до правдивого значення параметру 10;

  • Точність оцінок зростає при збільшенні вибірки n; найбільш точною є оцінка â2 , а найменш – оцінка â3 .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]