
Лабораторные в Excel по статистике / st_3
.docСтатистика
Цель работы. Решение простейших задач парной и множественной регрессии с помощью Excel.
Задание. Опишите регрессионной зависимостью следующие данные.
Каждый год девятиклассники юго-запада штата Огайо (США) сдают квалификационный тест. В файле 3.xls содержатся данные о 47 школах это штата за 1994-95 учебный год. Обозначения: School District – наименование района школы; Percentage Passing – количество студентов, прошедших тест (в процентах); Percentage Attendance – среднее в день количество присутствовавших школьников (в процентах); Salary – средняя зарплата учителя (в долларах); Spending – затраты на обучение ученика (в долларах).
Порядок выполнения работы
1. Постройте точечную зависимость
количества студентов, сдавших тест (),
от количества присутствовавших студентов
(
).
2. Предварительно ознакомившись со
справкой по встроенной функции ЛИНЕЙН()
определите с ее помощью коэффициенты
парной регрессии
и
для модели
,
а также статистику по регрессии. Для
этого выделите начиная с левого верхнего
угла массив из пяти строк и двух столбцов
(число столбцов равно числу искомых
коэффициентов в уравнении регрессии,
число строк всегда равно пяти), в который
будет помещена статистика по регрессии.
Укажите аргументы для функции ЛИНЕЙН().
После нажатия на OK,
нажмите функциональную клавишу F2,
а затем SHIFT+CTRL+ENTER.
3. Объясните смысл коэффициентов парной регрессии, исходя из специфики проблемы.
4. Нанесите на график, построенный
в п.1, линию регрессии, вычислив ее по
формуле
.
Если редактирование графика вызывает
трудности, постройте все заново. При
вычислении вектора
перейдите к абсолютной адресации по
и
,
поставив перед изменяемой частью адреса
ссылки символ $, или воспользуйтесь
функциональной клавишей F4.
5. Вычислите стандартную ошибку
оценки
и сравните ее с вычисленной в статистике
по регрессии..
6. Вычислите коэффициент детерминации
,
используя статистику по регрессии.
7. Вычислите коэффициент корреляции
и интерпретируйте его. Сравните три
способа вычисления коэффициента
корреляции: 1) как квадратный корень из
коэффициента детерминации; 2) как
коэффициент корреляции между
и
(с помощью встроенной функции КОРРЕЛ()),
3) как коэффициент корреляции между
и
.
8. Выполните анализ остатков
(
)
и визуально определите адекватность
модели по гистограмме распределения
остатков, воспользовавшись инструментом
Гистограмма.
9. Для уровня значимости 0.05 проверьте
существование линейной зависимости
между независимой и зависимой переменными
(в качестве нулевой гипотезы – гипотеза
о равенстве нулю коэффициента корреляции,
что эквивалентно гипотезе о
).
-
статистика имеет вид:
,
найдите с помощью встроенной функции
СТЬЮДРАСПОБР().
10. Найдите доверительный интервал
для вероятности 0.95 коэффициента наклона
линии регрессии ()
и интерпретируйте его. Значение
определено в статистике по регрессии.
11. Повторите пункты 1-10, рассматривая среднюю зарплату учителя как независимую переменную.
12. Повторите пункты 1-10, рассматривая затраты на обучение как независимую переменную.
13. Какая из трех моделей лучше предсказывает процент школьников, сдавших тест? Почему?
14. Определите параметры в модели множественной регрессии. Сравните коэффициент детерминации с лучшим из п.13. Какая из моделей лучше? Почему?
15. Повторите пункты 1-14 с помощью инструмента Регрессия Пакета анализа. Сравните полученные результаты.
Лабораторная работа №3