Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
22
Добавлен:
12.02.2015
Размер:
91.41 Кб
Скачать

Регрессия.

Корреляция – вероятностная или статистическая зависимость, т.е. в отличие от функциональной зависимости корреляция возникает тогда, когда зависимость осложняется наличием случайных факторов.

Регрессионный анализ является частью теории корреляции.

Регрессионный анализ используется для исследования форм связи, устанавливающих количественные соотношения между случайными величинами изучаемого стохастического процесса. (Стохастический процесс – процесс, в котором неизвестные факторы являются случайными величинами, для которых известны законы распределения вероятностей и другие статистические характеристики).

В программе STORM регрессионный анализ позволяет выявить степень зависимости одного диапазона данных (зависимая переменная) от одного или нескольких других диапазонов данных (независимая переменная). Зависимость выражается математически, с использованием значений, вычисленных с помощью программы. Эти вычисления можно использовать для создания математической модели данных и предсказания значения зависимой переменной, которая определяется различными значениями одной или нескольких независимых переменных.

Пример задачи и ее решения.

Известно, что два процесса протекают параллельно и характеризуются определенными числовыми значениями:

П1

1

2,3

3

3,8

5,1

6,2

П2

2,1

4,2

5,8

8,1

9,9

11,9

  1. Определите, существует ли взаимная связь между этими процессами.

  2. Выразите эту связь математической формулой.

  3. Предскажите значения для П2 при значении П1=2, П1=7.

Пуск / Сетевое меню / STORM / Regression.

1.Создайте новый набор данных.

Title Заглавие

Number of variables in data set Число переменных (зависимых и независимых) в наборе данных

Maximal number of cases for any variable Максимальное число случаев для любой переменной

Mussing value option (CNST/MEAN/OMIT) Каким образом обходиться с недостающими данными:

Const - Постоянный, Mean – Средний, Omit – Пренебречь

Х1, Х2 переменные

VAR TYPE тип переменной:

QUAN количественный

QUAL качественный

Case 1 данные для каждой переменной в первом случае.

Case N данные для каждой переменной в случае N.

2.Сохраните введенный файл под именем R1.dat

3.Решите задачу с имеющимся набором данных.

Меню задачи регрессии:

  1. Преобразование переменных (Variable transformation)

  2. Наглядная статистика (Descriptive statistics).

  3. Регрессионный анализ (Regression analysis).

Меню наглядной статистики:

  1. График (Scatter plots).

  2. Среднее, разброс и корреляционная матрица (Mean, variances and correlation matrix).

  3. Возвращение в меню регрессии (Return to Regression Options menu).

Воспользуйтесь пунктом «График», в открывшемся окне указав переменную для оси Х, чтобы увидеть графическое представление зависимости двух переменных. На графике видно, что зависимость линейная, вида “ax+b”. То есть, для того чтобы записать взаимную связь переменный в виде формулы, необходимо установить коэффициенты a и b.

Вернитесь в меню задачи регрессии (п.3 меню наглядной статистики), затем обратитесь к регрессионному анализу (п.3 меню задачи регрессии).

Меню регрессионного анализа:

  1. Простая регрессия (Simple regression)

  2. Множественная (многофакторная) регрессия (Multiple regression)

  3. Множественная регрессия с приоритетами (Multiple regression with priorities)

  4. Возвращение в меню регрессии

Обратитесь к пункту «Простая регрессия», укажите зависимую (dependent) и независимую (independent) переменные

Меню простой регрессии:

  1. Средняя, дисперсия и корреляционная матрица (указаны коэффициенты корреляции)

  2. Выполнение простой регрессии

  3. Возвращение в меню регрессионного анализа

  4. Возвращение в меню регрессии

Меню выполнения простой регрессии (п.2 меню простой регрессии).

  1. Краткий итог текущей регрессии (суммарный отчет, приводятся параметры уравнения линейной регрессии)

  2. Детальный итог текущей регрессии

  3. Отчет по разнице между реальными и предсказанными (прогнозируемыми) значениями переменных

  4. График распределения разницы в сравнении с прогнозной оценкой

  5. График распределения разницы в сравнении с переменной

  6. Возвращение в меню регрессионного анализа

  7. Возвращение в меню регрессии

Изучите информацию, предоставляемую меню, и ответьте на следующие вопросы:

  • Определите коэффициенты линейной регрессии и запишите формулу, выражающую взаимную связь между двумя процессами.

  • На основании критерия Фишера сделайте вывод о значимости найденной модели (для справки: значение статистики Фишера при уровне значимости α=0,05 в данном случае составляет≈7,7).

  • Запишите величину коэффициента детерминации и сделайте вывод о величине степени зависимости между изучаемыми процессами.

  • Предскажите значения для П2 при значении П1=2, П1=7

Слова для справки:

average - среднее

F value – Критерий Фишера

predicted – предсказание

residuals – разница

R-squared – коэффициент детерминации.

scatter - разброс

4.Создайте файл “Регрессия.rtf”, в котором запишите полученные ответы.

Задача для самостоятельного решения

Известно, что три процесса протекают параллельно и характеризуются определенными числовыми значениями:

Зависимая переменная Х1

1

2

3

4

5

Независимая переменная Х2

1,9

3,8

6,2

7,6

10,5

Независимая переменная Х3

3

6,5

9,2

11,8

15,3

Сохраните введенный файл под именем R2.dat

В созданном файле “Регрессия.rtf”запишите ответы на следующие вопросы (рекомендация: в данном случае необходимо в меню регрессионного анализа воспользоваться пунктом «Множественная (многофакторная) регрессия»):

  • Какова степень зависимости этих процессов и чем она характеризуется.

  • Запишите формулу, выражающую эту зависимость математически

  • Предскажите и запишите предсказанные значения зависимой переменной, при следующих значениях независимых переменных: 3,5 и 12.

Заархивируйте все созданные файлы под вашей фамилией и положите архив в папку с номером вашей группы на диске U.