Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
магистр _сгм - копия1111111.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
4.4 Mб
Скачать

Тема 4. Линейная множественная регрессия

Эта тема включает выполнение лабораторных работ, посвященных построению и исследованию уравнения линейной множественной регрессии вида

Пространственная выборка для построения этого уравнения взята из следующего примера.

  • Пример Данные о сменной добыче угля на одного рабочего (переменная Y), мощности пласта (переменная X1 и уровнем механизации работ в шахте (переменная X2) , характеризующие процесс добычи угля в 10 шахтах приведены в таблице. Предполагая, что между переменными Y, X1, X2 существует линейная зависимость, необходимо найти аналитическое выражение для этой зависимости, т.е. построить уравнение линейной регрессии.

Таблица

Номер шахты

i

xi1

xi2

yi

1

8

5

5

2

11

8

10

3

12

8

10

4

9

5

7

5

8

7

5

6

8

8

6

7

9

6

6

8

9

4

5

9

8

5

6

10

12

7

8

Лабораторная работа № 9

Вычисление коэффициентов ЛМР

Цель работы. Используя пространственную выборку необходимо вычислить вектор коэффициентов

уравнения регрессии .

Расчетные соотношения. Вектор коэффициентов, найденный методом наименьших квадратов является решением следующей системы уравнений:

,

где - матрица размера , первый столбец которой составлен из 1, а другие два столбца составлены из значений ,т.е. матрица имеет следующую структуру (символы … означают не отображенные элементы)

,

а - вектор, составленный из 10 значений , т.е. .

Матрица имеет обратную матрицу и тогда вектор коэффициентов вычисляется в виде:

.

Для реализации этой матричной формулы в необходимо выполнить следующие операции: транспонирование; умножение матриц (частный случай – умножение матрицы на вектор); вычисление обратной матрицы. Все эти операции можно реализовать с помощью следующих матричных функций Excel. Для работы с этими функциями можно или

а) обратиться к Мастеру функций и выбрать нужную категорию функций, затем указать имя функции и задать соответствующие диапазоны ячеек,

б) ввести с клавиатуры имя функции задать соответствующие диапазоны ячеек.

Транспонирование матрицы осуществляется с помощью функции ТРАНСП (категория функций – Ссылки и массивы). Обращение к функции имеет вид:

ТРАНСП (диапазон ячеек),

где параметр диапазон ячеек задает все элементы транспонируемой матрицы (или вектора).

Умножение матриц осуществляется с помощью функции МУМНОЖ (категория функций – Математические). Обращение к функции имеет вид:

МУМНОЖ(диапазон_1;диапазон_2),

где параметр диапазон_1 задает элементы первой из перемножаемых матриц, а параметр диапазон_2 – элементы второй матрицы. При этом перемножаемые матрицы должны иметь соответствующие размеры (если первая матрица , вторая - , то результатом будет матрица ).

Обращение матрицы (вычисление обратной матрицы) осуществляется с помощью функции МОБР (категория функций – Математические). Обращение к функции имеет вид:

МОБР (диапазон ячеек),

где параметр диапазон ячеек задает все элементы обращаемой матрицы, которая должна быть квадратной и невырожденной.

При использовании этих функций необходимо соблюдать следующий порядок действий:

  • выделить фрагмент ячеек, в которые будет занесен результат выполнения матричных функций (при этом надо учитывать размеры исходных матриц);

  • ввести арифметическое выражение, содержащее обращение к матричным функциям Excel;

  • одновременно нажать клавиши [Ctrl], [Shift], [Enter]. Если этого не сделать, то вычислится только один элемент результирующей матрицы или вектора.

Решение. Сформируем матрицу и вектор .

Рис.3.1. Вычисление коэффициентов множественной регрессии

Затем выполним формирование матрицы , вектора и вычисление вектора . Все эти вычисления показаны на рисунке.

Получен вектор коэффициентов и тогда уравнение регрессии примет вид:

Лабораторная работа № 10

Проверка значимости в режиме Регрессия

Цель работы. Используя пространственную выборку и используя режим Регрессия необходимо вычислить вектор коэффициентов уравнения регрессии

.

Режим Регрессия модуля Анализ данных. Табличный процессор Excel содержит модуль Анализ данных. Этот модуль позволяет выполнить статистический анализ выборочных данных (построение гистограмм, вычисление числовых характеристик и т.д.). Режим работы Регрессия этого модуля осуществляет вычисление коэффициентов линейной множественной регрессии с переменными, построение доверительные интервалы и проверку значимости уравнения регрессии.

Для вызова режима Регрессия модуля Анализ данных необходимо:

  • обратиться к пункту меню Сервис;

  • в появившемся меню выполнить команду Анализ данных;

  • в списке режимов работы модуля Анализ данных выбрать режим Регрессия и щелкнуть на кнопке Ok.

После вызова режима Регрессия на экране появляется диалоговое окно, в котором задаются следующие параметры:

  1. Входной интервал Yвводится диапазон адресов ячеек, содержащих значения (ячейки должны составлять один столбец).

Рис. 3.2. Диалоговое окно режима Регрессия

  1. Входной интервал Xвводится диапазон адресов ячеек, содержащих значения независимых переменных. Значения каждой переменной представляются одним столбцом. Количество переменных не более 16 (т.е. ).

  2. Метки – включается если первая строка во входном диапазоне содержит заголовок. В этом случае автоматически будут созданы стандартные названия.

  3. Уровень надежности – при включении этого параметра задается надежность при построении доверительных интервалов.

  4. Константа-ноль – при включении этого параметра коэффициент .

  5. Выходной интервал – при включении активизируется поле, в которое необходимо ввести адрес левой верхней ячейки выходного диапазона, который содержит ячейки с результатами вычислений режима Регрессия.

  6. Новый рабочий лист – при включении этого параметра открывается новый лист, в который начиная с ячейки А1 вставляются результаты работы режима Регрессия.

  7. Новая рабочая книга - при включении этого параметра открывается новая книга на первом листе которой начиная с ячейки А1 вставляются результаты работы режима Регрессия.

  8. Остатки – при включении вычисляется столбец, содержащий невязки .

  9. Стандартизованные остатки – при включении вычисляется столбец, содержащий стандартизованные остатки.

  10. График остатков – при включении выводятся точечные графики невязки , в зависимости от значений переменных . Количество графиков равно числу переменных .

  11. График подбора – при включении выводятся точечные графики предсказанных по построенной регрессии значений от значений переменных . Количество графиков равно числу переменных .

Решение. Первоначально введем в столбец С десять значений первой переменной, в столбец D - десять значений первой переменной, а в столбец F – десять значений зависимой переменной.

После этого режим Регрессия и в диалоговом окне зададим необходимые параметры. Заметим, из-за большой «ширины» таблиц, в которых выводятся результаты работы режима Регрессия, часть результатов помещены в другие ячейки.

Дадим краткую интерпретацию показателям, значения которых вычисляются в режиме Регрессия. Первоначально рассмотрим показатели, объединенные названием Регрессионная статистика (см. рис. 3.3).

Множественный - корень квадратный из коэффициента детерминации.

квадрат – коэффициент детерминации .

Рис. 3.3. Результаты работы режима Регрессия

Нормированный квадрат – приведенный коэффициент детерминации (см. формулу (2.1)).

Стандартная ошибка – оценка для среднеквадратического отклонения .

Наблюдения – число наблюдений .

Перейдем к показателям, объединенных названием Дисперсионный анализ.

Столбец - число степеней свободы.

Для строки Регрессия показатель равен числу независимых переменных ;

для строки Остаток - равен ;

для строки Итого – равен .

Столбец SS – сумма квадратов отклонений.

Для строки Регрессия показатель равен величине , т.е.

;

для строки Остаток - равен величине , т.е.

;

для строки Итого – равен .

Столбец дисперсии, вычисленные по формуле ,

т.е. дисперсия на одну степень свободы.

Столбец значение , равное критерию Фишера, вычисленного по формуле: .

Столбец значимость - значение уровня значимости, соответствующее вычисленной величине критерия и равное вероятности

,

где - случайная величина, подчиняющаяся распределению Фишера с степенями свободы. Эту вероятность можно также определить с помощью функции FРАСП( ). Если вероятность меньше уровня значимости (обычно ), то построенная регрессия является значимой..

Перейдем к следующей группе показателей, объединенных в таблице.

Рис.3.4. Продолжение результатов работы режима Регрессия

Столбец Коэффициенты – вычисленные значения коэффициентов , расположенных сверху-вниз.

Столбец Стандартная ошибка – значения , вычисленные по формуле .

Столбец статистика – значения статистик .

Столбец Р – значение – содержит вероятности случайных событий , где случайная величина, подчиняющаяся распределению Стьюдента с степенями свободы.

Если эта вероятность меньше уровня значимости , то принимается гипотеза о значимости соответствующего коэффициента регрессии.

Значимым коэффициентом является только коэффициент .

Столбцы Нижние 95% и Верхние 95% - соответственно нижние и верхние интервалы для оцениваемых коэффициентов .

Перейдем к следующей группе показателей, объединенных в таблице, показанной на рис. 3.5.

Рис. 3.5. Продолжение результатов работы режима Регрессия

Столбец Наблюдение – содержит номера наблюдений.

Столбец Предсказанное У – значения , вычисленные по построенному уравнению регрессии.

Столбец Остатки – значения невязок

В заключении рассмотрения результатов работы режима Регрессия приведем график невязок (невязки названы остатками) при заданных значениях только второй переменной.

Наличие чередующихся положительных и отрицательных значений невязок косвенным признаком отсутствия систематической ошибки (неучтенной независимой переменной) в построенном уравнении регрессии.

Рис. 3.6. График невязок как функция переменной

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]