Скачиваний:
28
Добавлен:
01.05.2014
Размер:
66.05 Кб
Скачать

Статистика

Цель работы. Решение простейших задач парной и множественной регрессии с помощью Excel.

Задание. Опишите регрессионной зависимостью следующие данные.

Каждый год девятиклассники юго-запада штата Огайо (США) сдают квалификационный тест. В файле 3.xls содержатся данные о 47 школах это штата за 1994-95 учебный год. Обозначения: School District – наименование района школы; Percentage Passing – количество студентов, прошедших тест (в процентах); Percentage Attendance – среднее в день количество присутствовавших школьников (в процентах); Salary – средняя зарплата учителя (в долларах); Spending – затраты на обучение ученика (в долларах).

Порядок выполнения работы

1. Постройте точечную зависимость количества студентов, сдавших тест (), от количества присутствовавших студентов ().

2. Предварительно ознакомившись со справкой по встроенной функции ЛИНЕЙН() определите с ее помощью коэффициенты парной регрессии и для модели , а также статистику по регрессии. Для этого выделите начиная с левого верхнего угла массив из пяти строк и двух столбцов (число столбцов равно числу искомых коэффициентов в уравнении регрессии, число строк всегда равно пяти), в который будет помещена статистика по регрессии. Укажите аргументы для функции ЛИНЕЙН(). После нажатия на OK, нажмите функциональную клавишу F2, а затем SHIFT+CTRL+ENTER.

3. Объясните смысл коэффициентов парной регрессии, исходя из специфики проблемы.

4. Нанесите на график, построенный в п.1, линию регрессии, вычислив ее по формуле . Если редактирование графика вызывает трудности, постройте все заново. При вычислении вектора перейдите к абсолютной адресации по и , поставив перед изменяемой частью адреса ссылки символ $, или воспользуйтесь функциональной клавишей F4.

5. Вычислите стандартную ошибку оценки и сравните ее с вычисленной в статистике по регрессии..

6. Вычислите коэффициент детерминации , используя статистику по регрессии.

7. Вычислите коэффициент корреляции и интерпретируйте его. Сравните три способа вычисления коэффициента корреляции: 1) как квадратный корень из коэффициента детерминации; 2) как коэффициент корреляции между и (с помощью встроенной функции КОРРЕЛ()), 3) как коэффициент корреляции между и .

8. Выполните анализ остатков () и визуально определите адекватность модели по гистограмме распределения остатков, воспользовавшись инструментом Гистограмма.

9. Для уровня значимости 0.05 проверьте существование линейной зависимости между независимой и зависимой переменными (в качестве нулевой гипотезы – гипотеза о равенстве нулю коэффициента корреляции, что эквивалентно гипотезе о ). - статистика имеет вид: , найдите с помощью встроенной функции СТЬЮДРАСПОБР().

10. Найдите доверительный интервал для вероятности 0.95 коэффициента наклона линии регрессии () и интерпретируйте его. Значение определено в статистике по регрессии.

11. Повторите пункты 1-10, рассматривая среднюю зарплату учителя как независимую переменную.

12. Повторите пункты 1-10, рассматривая затраты на обучение как независимую переменную.

13. Какая из трех моделей лучше предсказывает процент школьников, сдавших тест? Почему?

14. Определите параметры в модели множественной регрессии. Сравните коэффициент детерминации с лучшим из п.13. Какая из моделей лучше? Почему?

15. Повторите пункты 1-14 с помощью инструмента Регрессия Пакета анализа. Сравните полученные результаты.

Лабораторная работа №3

Соседние файлы в папке Лабораторные в Excel по статистике