Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
регрессионный.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
275.7 Кб
Скачать

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ

ГОУ ВПО «ПОМОРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М.В. ЛОМОНОСОВА»

Кафедра психологии

Отчет

по дисциплине: Математические методы в психологии.

Тема: регрессионный анализ

Выполнили:

Студентки 2 курса

Коржева О.А. и Панкова Е. Н.

Архангельск,

2013 г.

Задача №1.

Данная задача является модификацией примера регрессионного анализа, рассмотренного в учебнике по экспериментальной психологии Джеймса Гудвина (С. James Goodwin) (2004, с.484, 486-487).

Исследователь пытается выявить взаимосвязь между количеством времени X, бесполезно потраченного студентами, и средним баллом Y их академической успеваемости, который варьируется в пределах от 2,0 до 5,0. Под потраченным без пользы временем понимается количество часов определенного соответствующего времяпровождения в неделю (например, занятого просмотром «мыльных» телесериалов). Данные для выборки студентов приведены в табл. 1

Требуется построить линейную регрессионную зависимость среднего балла успеваемости от показателя бесполезно потраченного времени, а также выполнить прогноз успеваемости для значений X, равных 20, 30 и 40 часов.

В ответе к задаче приведите: а) скорректированный процент объясняемой моделью дисперсии отклика, б) оценку уровня значимости регрессии по F-критерию, в) нестандартизованные коэффициенты регрессионного уравнения и оценки их значимости по t-критерию, г) номер наблюдения, имеющего наибольший по модулю остаток, д) прогнозируемые значения отклика.

Таблица 1.

Средний балл успеваемости студентов и показатель бесполезно потраченного ими времени

X

Y

X

Y

X

Y

1

42

2,8

4

35

3,9

7

39

3,4

2

23

4,0

5

16

4,7

8

19

4,4

3

31

3,2

6

26

4,0

9

29

3,80

Решение:

Задачу необходимо при помощи простой регрессионной модели.

Первоначально посмотрим на значение р-уровня значимости по критерию F-Фишера.

Таблица 2.

Дисперсионный анализb

Модель

Сумма квадратов

ст.св.

Средний квадрат

Щ

Знч.

1

Регрессия

2,210

1

2,210

27,124

,001a

Остаток

,570

7

,081

Всего

2,780

8

a. Предикторы: (конст) время потраченное зря

b. Зависимая переменная: успеваемость

Из таблицы 2 видно, что р-уровень значимости статистически достоверен, поэтому модель может быть содержательно интерпретирована.

Далее посмотрим на значение скорректированного R-квадрата.

Таблица 3.

Сводка для моделиb

Модель

Н

R-квадрат

Скорректи-рованный R-квадрат

Стд. ошибка оценки

1

,892a

,795

,766

,2854

a. Предикторы: (конст) время потраченное зря

b. Зависимая переменная: успеваемость

Из таблицы 3 видно, что значение КМД (0,795) достаточно велико, т.е. регрессионная модель объясняет более 79,5% дисперсии зависимой переменной, и результаты предсказания могут быть приняты во внимание, а скорректированный процент объясняемой моделью дисперсии отклика равен 76,6%, что приводит к незначительному уменьшению R-квадрат.

Таблица 4.

Коэффициентыa

Модель

Нестандартизованные коэффициенты

Стандартизованные коэффициенты

t

Знч.

B

Стд. Ошибка

Бета

1

(Константа)

5,521

,344

16,057

,000

Время, потраченное зря

-,060

,011

-,892

-5,208

,001

a. Зависимая переменная: успеваемость

Из таблицы 4 видно, что значимость регрессионного коэффициента по критерию t-Стьюдента является достоверной (0,001). Вклад переменной (Время, потраченное зря) является значимым - 89%, и мы можем включить данный коэффициент в уравнение.

Таблица 5.

Время потраченное зря

Успеваемость

Остаток

1

42

2,8

-0,21909

2

23

4,0

-0,15075

3

31

3,2

-0,47426

4

35

3,9

0,46399

5

16

4,7

0,13232

6

26

4,0

0,02793

7

39

3,4

0,20223

8

19

4,4

0,01101

9

29

3,8

0,00662

По полученным остаткам, приведенным в базе «Задача 1», видим, что наибольший по модулю остаток имеет испытуемый №3.

Уравнение регрессии:

У (х)= 5,521 – 0,060*(время потраченное зря).

Построим линейную регрессионная зависимость среднего балла успеваемости от показателя бесполезно потраченного времени:

Рис 1. Линейная регрессионная зависимость среднего балла успеваемости от показателя бесполезно потраченного времени.

Прогноз успеваемости для значений X, равных 20, 30 и 40 часов:

У (20) = 5,521 – 0,060 * 20 = 4,321

- студенты, тратящие примерно 20 часов в неделю на бесполезные дела, имеют более высокие оценки зависимой переменной, следовательно, их академическая успеваемость намного выше;

У (30) = 5,521 – 0,060 * 30 = 3,721

- студенты, тратящие без пользы 30 часов в неделю, имеют менее высокие оценки зависимой переменной, соответственно у них наблюдается средняя академическая успеваемость;

У (40) = 5,521 – 0,060 * 40 = 3,121

- учащиеся, которые тратят по 40 часов в неделю без пользы, обладают самыми низкими показателями оценки зависимой переменной и низкой академической успеваемостью.

Таким образом, мы можем сделать вывод о том, что чем большее количество времени тратится студентом на бесполезные дела, тем ниже его академическая успеваемость.

Ответы:

а) скорректированный процент объясняемой моделью дисперсии отклика равен 76,6%;

б) оценка уровня значимости регрессии по F-критерию равна 28, 5;

в) нестандартизованный коэффициент регрессионного уравнения и оценка его значимости по t-критерию равны -0,060 и 0,001 соответственно;

г) наибольший по модулю остаток имеет испытуемый №3;

д) чем большее количество времени тратится студентом на бесполезные дела, тем ниже его академическая успеваемость.

Таблица 6.

время потраченное зря

Успеваемость

Прогнозируемая оценка зависимой переменной

42

2,8

3,01909

23

4

4,15075

31

3,2

3,67426

35

3,9

3,43601

16

4,7

4,56768

26

4

3,97207

39

3,4

3,19777

19

4,4

4,38899

29

3,8

3,79338