- •Лабораторна робота № 2 Тема: Кореляційно-регресійний аналіз
- •Частина 1. Кореляційний аналіз. Множинна кореляція
- •Завдання 1
- •1.1. Отримати та проаналізувати описову статистику заданих наборів даних. Оцінити середнє значення по у.
- •1.2.Встановити ступінь лінійного зв’язку між вибірками, застосовуючи:
- •Множинна кореляція
- •Частина 2. Регресійний аналіз
- •Порядок виконання роботи
- •Список питань до лабораторної роботи 2
- •Додатки
- •Стандартні коефіциєнти кореляції, які вважаються достовірными (по л.С. Каміиському)
Частина 2. Регресійний аналіз
Завдання. Опишіть регресійною залежністю наступні дані.
Кожного року дев’ятикласники штату Огайо (США) здають кваліфікаційний тест. В файлі st_3.xls містяться дані про 47 шкіл цього штату за 1994-95 навчальний рік. Позначення: School District – найменування району школи; Percentage Passing – кількість школярів, які пройшли тест (в процентах); Percentage Attendance – середня за день кількість присутніх школярів (в процентах); Salary – середня зарплата вчителя (в долларах); Spending – затрати на навчання учня (в доларах).
Порядок виконання роботи
1.
Побудуйте точкову залежність кількості
школярів, які здали тест (
),
від кількості присутніх школярів (
).
2.
За
допомогою функції
ЛИНЕЙН()
визначте
з
її
допомогою
коефіцієнти
парної
регресії
і
для моделі
,
а також
статистику по регрессії.
Для цього
виділіть
починаючи
з
лівого
верхнього
кута
масив з п’яти
рядків
і
двох
стовбців
(кількість
стовбців
рівну
числу коефіцієнтів,
які треба знайти,
в рівнянні
регресії,
кількість
рядків
завжди
дорівнює
5),
в якій
буде
розміщена
статистика по регресії.
Вкажіть
аргументи
для функції
ЛИНЕЙН().
Після
натиснення
на OK,
нажміть
функціональну
клавішу
F2,
а потім
SHIFT+CTRL+ENTER.
3.
Нанесіть
на графік,
який
побудований
в п.1, лінію
регресії,
обчисливши
її
за
формулою
.
При обчисленні
вектора
перейдіть
до
абсолютної
адресації
по
і
,
поставивши
перед частиною
адреси
посилання
що змінюється
символ $,
або
скористайтесь
функціональною
клавішею
F4.
4.
Обчисліть
стандартну похибку
оцінки
і
порівняйте
її
з
обчисленою
в статистиці
по регресії
5.
Обчисліть
коефіцієнт
детермінації
,
використовуючи
статистику по регресії.
(Чим
ближче його значення до 1, тим краща
модель).
6. Обчисліть коефіцієнт кореляції і інтерпретируйте його. Порівняйте три способи обчислення коэфіцієнта кореляції: 1) як квадратний корінь з коефіцієнта детермінації; 2) як коефіцієнт кореляції між і (за допомогою вбудованої функції КОРРЕЛ()), 3) як коефіцієнт кореляції между и .
7.
Виконайте
аналіз
залишків
(
)
і
візуально
визначте
адекватність
моделі
по гістограмі
розподілу
залишків.
8.
Для рівня значимості 0.05 перевірте
наявність лінійної залежності між
незалежною і залежною змінними (в якості
нульової гіпотези – гіпотеза про
рівність нулю коефіцієнта кореляції,
що еквівалентно гіпотезі про
).
-
статистика має вигляд:
,
знайдіть за допомогою вбудованої функції
СТЬЮДРАСПОБР().
Для даної функції аргумент ймовірність
=
0.95, степені
волі
– 45. Гіпотеза приймається, якщо значення
t
потрапляє
в інтервал -tкрит
<= t
<= tкрит.
9. Повторіть пунки 1-10, розглядаючи среднюю зарплату учителя як незалежну змінну.
10. Повторіть пункти 1-10, розглядаючи затрати на навчання як незалежну змінну.
11. Яка з трьох моделей краще передбачає процент школярів, які здали тест? Чому так?
12. За допомогою функції ЛИНЕЙН() визначте параметри множинної регресії. Побудуйте модель множинної регресії: yy=a+b1*x+b2*z+b3*t. Порівняйте графіки y та yy.
13. Відкрийте Пакет аналіза в EXCEL. За допомогою інструмента Регресія знайдіть параметри та коефіцієнти регресії та порівняйте їх зі знайденими за допомогою вбудованих функцій. (Сервіс, аналіз данних, регресія, відмічаємо діапазон у – passing, x -salari) і порівнюємо R^2 та Коефіцієнти з тими, які отримані в результаті застосування функції ЛИНЕЙН() для відповідних діапазонів.
14. Запишіть рівняння регресії за допомого отриманих коефіцієнтів.
