Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lab_IVK.doc
Скачиваний:
3
Добавлен:
16.11.2019
Размер:
713.73 Кб
Скачать

Технологія кореляційно-регресійного аналізу в ms Excel

Невід’ємною складовою частиною сучасного офісного програмного забезпечення персонального комп’ютера є табличний процессор MS Excel. Існують різні способи проведення кореляційно-регресійного аналізу (рис.5.5).

Рис.5.5. Кореляційно-регресійне моделювання у MS Excel

У MS Excel для одновимірної регресії на кількох класах функцій (лінійні, степеневі, логарифмічні тощо) лінії тренда можна побудувати графічно за допомогою засобу Мастер диаграмм. При цьому передбачається вивід на екран коефіцієнта кореляції, рівняння лінії тренда та продовження її з метою одержання прогнозованого значення. Для задач нелінійної регресії Мастер диаграмм знаходить наближений розв’язок, оскільки параметри регресії обчислюються на основі спрощених лінеаризованих моделей (лінеаризовані моделі розглянуті нижче). Технологія використання цього засобу для проведення кореляційно-регресійного моделювання детально розглянута в [8, 12].

Задачу регресійного аналізу, що полягає у знаходженні мінімального значення деякої цільової функції, можна розв’язати за допомогою засобу Поиск решения MS Excel - як для одновимірної, так і для багатовимірної регресії різних типів. Виконання моделювання цим засобом детально описано у [13].

У MS Excel для лінійної та показникової регресії (включаючи багатовимірну) є вбудовані функції ЛИНЕЙН(.) та ЛГРФПРИБЛ(.), за допомогою яких обчислюються параметри регресії відповідно на класах лінійних та показникових функцій. Апроксимаційні та прогнозні значення для названих типів регресії можна обчислити двома способами: по-перше, використати параметри регресії, знайдені за функціями ЛИНЕЙН(.) та ЛГРФПРИБЛ(.), по-друге, скористатися вбудованими функціями ТЕНДЕНЦИЯ(.) та РОСТ(.) відповідно.

Функції ЛИНЕЙН(.) та ЛГРФПРИБЛ(.), крім параметрів регресії, повертають статистичну інформацію для регресії.

Синтаксис функцій:

ЛИНЕЙН (изв_знач_y; изв_знач_x; конст; статистика)

ЛГРФПРИБЛ(изв_знач_y; изв_знач_x; конст; статистика)

ТЕНДЕНЦИЯ(изв_знач_y; изв_знач_x; нов_знач_x; конст)

РОСТ(изв_знач_y; изв_знач_x; нов_знач_x; конст)

Аргументи функцій:

Изв_знач_y - діапазон, що містить значення залежної змінної для точок спостереження.

Изв_знач_x - діапазон, що містить значення незалежної змінної (масив значень - для багатовимірної регресії та вектор значень - для одновимірної регресії).

Якщо изв_знач_y задано як стовпець, то кожний стовпець масиву изв_знач_x розглядається як окрема змінна. Кількість елементів у стовпці изв_знач_у має збігатися з кількістю рядків у масиві изв_знач_x.

Якщо изв_знач_y задано як рядок, то кожний рядок масиву изв_знач_x розглядається як окрема змінна. Кількість елементів у рядку изв_знач_у має збігатися з кількістю стовпців у масиві изв_знач_x.

Для одновимірної регресії число елементів у діапазонах изв_знач_y та изв_знач_x має збігатися, а їх орієнтація може бути довільною.

Аргумент изв_знач_x можна випустити, якщо незалежна змінна має значення: 1,2,3,…

Конст - необов’язковий аргумент, який може набувати значення ИСТИНА або ЛОЖЬ. Значення ЛОЖЬ означає, що:

  • для лінійної регресії (функції ЛИНЕЙН(.), ТЕНДЕНЦИЯ(.));

  • для показникової регресії (функції ЛГРФПРИБЛ(.), РОСТ(.)).

Якщо іншого не вказано, приймається значення ИСТИНА, що означає вибір параметрів регресії звичайним способом.

Статистика - необов’язковий аргумент, який може набувати логічного значення (ИСТИНА або ЛОЖЬ). Значення ИСТИНА вказує, що функція, крім параметрів регресії, виводить регресійну статистику. Якщо іншого не вказано, приймається значення ЛОЖЬ – це означає, що функція виводить тільки параметри регресії.

Регресійна статистика дає змогу оцінити адекватність вибраної апроксимаційної моделі.

Нов_знач_x – діапазон, що містить значення незалежної змінної , для яких обчислюється апроксимація залежної змінної .

Якщо аргумент изв_знач_y задано як стовпець, то масиви изв_знач_x та нов_знач_x повинні мати однакову кількість стовпців.

Якщо аргумент изв_знач_y задано як рядок, то масиви изв_знач_x та нов_знач_x повинні мати однакову кількість рядків.

Якщо аргумент нов_знач_x не задано, то в аргумент підставляються значення із аргументу изв_знач_x. Якщо два аргументи изв_знач_x та нов_знач_x не задано, то для аргументів підставляються значення із масиву {1, 2, 3, ….} (розмір масиву збігається із кількістю елементів аргументу изв_знач_y).

Усі названі функції є функціями масиву, тобто повертають декілька значень. Тому перш ніж вводити функції у клітини робочого аркушу, необхідно виділити діапазон, який міститиме значення, що повертаються функціями. Крім того, для вводу обчислених значень у виділений діапазон клітин, необхідно використовувати комбінацію клавіш CTRL+SHIFT+ENTER.

Нижче наведено розташування елементів у масивах, що повертають функції.

Функції ЛИНЕЙН (), ЛГРФПРИБЛ ()

Багатовимірна регресія

Проста регресія

де: … - коефіцієнти при незалежних змінних рівняння;

- вільний член;

… , - стандартні значення помилок для … та ;

- коефіцієнт детермінації;

- стандартна помилка для оцінки y;

- F-критерій за рівнянням (для оцінки );

- ступені свободи;

, - регресійна і залишкова сума квадратів.

Для оцінки вільного члена та коефіцієнтів рівняння розраховується t критерій за рівнянням :

Регресійна статистика дозволяє провести експертизу моделі шляхом зіставлення значень, отриманих за рівнянням (F - критерій Фішера та t – критерій Стьюдента) з даними статистичних таблиць. Для отримання табличних даних використовуються функції FРАСПОБР(.), СТЬЮДРАСПОБР(.)

Синтаксис функцій:

FРАСПОБР(вероятность; степени_св1; степени_свободы)

СТЬЮДРАСПОБР(вероятность; степени_свободы)

Аргументи функцій:

  • Вероятность - ймовірність (менша ніж 0,05).

  • Степени_св1 - розмірність рівняння.

  • Степени_свободы - значення , обчислене вище.

Якщо значення, отримані за рівнянням, більші за значення, обчислені за допомогою вищенаведених функцій, модель можна використовувати для прогнозування.

Прогнозування значень за отриманою моделлю проводиться за допомогою функцій ТЕНДЕНЦИЯ(.) та РОСТ(.), які повертають масиви значень (елементи стовпця чи рядка). Орієнтація вихідного масиву залежить від орієнтації масиву, що задається аргументом изв_знач_у, а розмір вихідного масиву - від відповідного розміру масиву, що задається аргументом нов_знач_x.

Для одновимірної регресії кількість елементів вихідного масиву дорівнює кількості елементів у аргументі нов_знач_x.

Для багатовимірної регресії:

  • якщо значення изв_знач_у розташовані у стовпці, то розмір вихідного масиву дорівнює кількості рядків масиву, заданому в аргументі нов_знач_x;

  • якщо значення изв_знач_у розташовані у рядку, то розмір вихідного масиву дорівнює кількості стовпців масиву, заданому в аргументі нов_знач_x.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]