Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Регр. анал лаб.вариант Грачёва 14.doc
Скачиваний:
38
Добавлен:
26.03.2016
Размер:
509.95 Кб
Скачать

1. Подготовка к проведению работы

1.1. Повторить изученные в курсе информатики знания и приёмы работы с программой MS Excel [7], в частности, со статистическими функциями и инструментами анализа [8 - 10].

1.2. Прочесть гл. 2 учебного пособия [5], описывающую теорию регрессионного анализа, а также функции и инструменты программы MS Excel, предназначенные для регрессионного анализа.

1.3. Прочитать нормативные документы [1 - 4].

1.4. Освоить приёмы работы с пакетом анализа, имеющемся в установленной версии Windows, и инструментом анализа «Выборка», необходимым для выбора варианта исходных данных, предназначенного для Вашего последующего расчёта [8, 10].

1.5. Выбор вариантов исходных данных для последующего выполнения однофакторного и многофакторного регрессионного анализа.

1.5.1. Открыть файл MS Excel «однофакторный регрессионный анализ» лист «исходные данные», содержащий результаты исследования влияния стажа работы на производительность, которые следует обработать, получив искомую зависимость. В представленных строках ячеек содержатся в качестве «предиктора» (фактора) изменяющиеся значения стажа работы исполнителей и соответствующие им характеристики производительности этих работников, иначе «результативного при­знака» (отклика). Имеется по 4 варианта предиктора и 3 варианта отклика, из которых каждому студенту следует выбрать случайным образом по одному варианту для последующего регрессионного анализа.

1.5.2. Открыть инструмент анализа «Выборка» (рис. 1) программы MS Excel и дважды произвести выборки случайного типа: одного «результативного при­знака» (Y) из трёх представленных и одного «предиктора» (X) из четырёх представленных. Для этого указать 1 (один) в «Число выборок» и номера от 1 до 3 (три расположенные рядом ячейки) или номера от 1 до 4 во «Входной интервал».

Рис. 1. Опции инструмента «Выборка»

1.5.3. Сообщить преподавателю выбранные варианты предиктора X и отклика Y и скопировать их на лист «анализ».

1.5.4. Открыть файл MS Excel «многофакторный регрессионный анализ», содержащий результаты контроля пяти технологических факторов xi (h, k, μ, Pb, Si) и отклика (y) в 142 точках (опытах) реально проводившегося эксперимента.

1.5.5. Выбрать случайным образом из 142 точек 2 точки эксперимента с помощью инструмента анализа «Выборка», см. п. 1.5.2. Для этого указать в «Число выборок» число 2 и во «Входной интервал» - массив из 142 номеров опытов эксперимента.

1.5.6. После согласования с преподавателем исключить из исходной таблицы две выбранные точки эксперимента, сформировав таблицу данных для 140 оставшихся экспериментальных точек.

2. Однофакторный регрессионный анализ

2.1. Инструмент анализа «Регрессия»

2.1.1. Основные опции инструмента «Регрессия»

2.1.1.1. Открыть инструмент анализа «Регрессия» (рис. 2), позволяющий получить коэффициенты и уравнения линейной регрессии

Y= + X, (1)

описывающего зависимость контролируемой величины отклика Y от выбранного фактора X.

2.1.1.2. Ввести во «Входной интервал x» столбец значений x, а во «Входной интервал y» - столбец соответствующих значений отклика y.

Примечания:

А. При расположении значений x и y в виде строк массив данных необходимо предварительно транспонировать.

Б. Для получения уравнения регрессии без свободного члена (чтобы линия регрессии прошла через начало координат) следует в опцию «Константа - ноль» поставить «галочку» (в нашем случае этого не требуется).

Рис. 2. Окно инструмента анализа «Регрессия»

2.1.1.3. Нажать «ОК», в результате чего для принятого по умолчанию «Уровня надёжности» g = 95% будут получены результаты регрессионного анализа, представленные как минимум (если не включены отмеченные ниже дополнительные опции) в виде трёх таблиц:

1. Таблица «Регрессионная статистика» включает в себя рассчитанные значения следующих показателей:

- коэффициента корреляции («Множественный R», для однофакторного регрессионного анализа определяется коэффициент парной корреляции r);

- квадрата коэффициента корреляции r (аналога коэффициента детерминации применительно к однофакторному регрессионному анализу, «R-квадрат»);

- числа наблюдений n;

- аналога нормированного коэффициента детерминации применительно к однофакторному регрессионному анализу (). Он более объективно определяет достоверность связи, так как, в отличие от обычного коэффициента детерминации, не зависит от числа опытов (n) и числа факторов k (k = 1 для однофакторного анализа):

(2)

- стандартной ошибки единичного наблюдения:

(3)

2. Таблица «Дисперсионный анализ» включает в себя следующие оценки, обусловленные регрессией («Регрессия»), не обусловленные регрессией («Остаток») и суммарные («Итого»):

- число степеней свободы df;

- оценку дисперсии для рассматриваемой выборки отклика («SS»);

- оценку дисперсии, приходящуюся на одну степень свободы («MS»).

Кроме того, выводятся расчётное значение F-критерия Фишера ()и «значимость F» - значение уровня значимости для вычисленного значения F, которое для проверки достоверности полученного уравнения регрессии сравнивается с принятым уровнем значимости (Напомним, что уровень значимости α определяется из «Уровня надёжности» g, см. рис. 2, по формуле: ).

3. Таблица результатов собственно регрессионного анализа (информация об уравнении регрессии) включает в себя коэффициенты регрессии (столбец «Коэффициенты») уравнения (3): свободного члена («Y-пересечение») и в столбце «коэффициенты», а также характеристики точности и достоверности каждого коэффициента регрессии. К ним относятся:

- «Стандартная ошибка» (стандартное отклонение) ;

- «t-статистика» - (расчётные значения коэффициентов Стьюдента) ;

- «P-Значение» - вероятность значимости;

- «Нижнее» и «Верхнее» 95-процентные отклонения от среднего значения (интервальные оценки) соответственно заданной по умолчанию 95-процентной доверительной вероятности и любой другой (если она задана).

2.1.1.4. Проверить достоверность каждого из рассчитанных Вами коэффициентов регрессии двумя способами:

- сравнивая величину «P-Значения» с принятым уровнем значимости α. В случае, когда «P-Значение» < α, делается вывод о достоверности коэффициентов регрессии; в противном случае делается вывод, что регрессионная модель нуждается в коррекции. (Это может быть связано с недостаточным объёмом данных, преобладающим влиянием случайных факторов над влиянием рассматриваемого фактора или нелинейной зависимостью отклика y от рассматриваемого фактора x [5]);

- сравнивая расчётные значения коэффициентов Стьюдента с их «критическим» (табличным) значением, определяемым по справочной литературе или используя статистическую функцию СТЬЮДРАСПОБР (для числа степеней свободы f = n-1=9 и уровня значимости α=0,05 tкрит =2,26). В случае, когда t > tкрит, делается вывод о достоверности коэффициентов регрессии.

2.1.1.5. Записать уравнение линейной регрессии, определяющей зависимость контролируемой характеристики y от фактора (x) y = b0 + b1x, по полученным коэффициентам регрессии, представленным во втором столбце «коэффициенты»:

- «Y-пересечение» - коэффициент b0;

- «Переменная X 1» - коэффициент b1.