Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Данилова Л.В. Лаб. практикум по матем. в Excel. 2017.doc
Скачиваний:
0
Добавлен:
15.03.2026
Размер:
10.87 Mб
Скачать

Лабораторная работа 2 Метод наименьших квадратов

Решим задачу подбора функциональной зависимости y от x по имеющимся измерениям или наблюдениям ( ), ( ), …, ( ). Пусть F – некоторый класс функций (например, линейных или квадратичных, или степенных и т.д.). Найдем функцию из F такую, чтобы ее значения наилучшим образом приближали значения . Функцию f(x) будем подбирать так, чтобы остатки (погрешности) по модулю были как можно меньшими. Удобнее всего минимизировать сумму квадратов остатков .

В Excel предусмотрен мощный инструмент «Поиск решения», который позволяет находить решение, при котором значение в определенной (целевой) ячейке рабочего листа достигает максимума или минимума. Целевая ячейка зависит от группы ячеек, которые называются изменяемыми ячейками. Их значения надо подобрать так, чтобы получить требуемый результат в целевой ячейке.

Если в меню «Сервис» отсутствует «Поиск решения», то необходимо выполнить команду «Сервис/Надстройки» и поставить галочку в окошке «Поиск решения».

Задача 2.1

Дан набор точек: (-2;0,5), (0;1), (1;1,5), (2;2), (4;3). Необходимо:

  1. Методом наименьших квадратов найти коэффициенты k и b прямой линии , наилучшим образом приближающей (аппроксимирующей) данные.

  2. В одной системе координат построить исходные данные и приближающую их прямую.

Решение

Ищем зависимость в виде . В этом случае сумма квадратов остатков является функцией k и b: . Нужно найти такие значения параметров k и b, при которых функция S минимальна. Выполним следующие действия:

  1. Введем координаты точек ( ), i = 1, 2, 3, 4, 5 в диапазон А2:В6 (рис. 2.1).

Рис. 2.1

  1. Начальные значения коэффициентов k = 0, b = 0 поместим в ячейки А9, В9 соответственно.

  2. В диапазоне С2:С6 вычислим . Для этого в ячейку С2 введем формулу = $A$9*A2 + $B$9 и копируем ее в С3:С6.

  3. Для нахождения остатков введем в D2 формулу = В2-С2 и копируем ее в D3:D6.

  1. В D9 найдем S – сумму квадратов погрешностей, воспользовавшись встроенной функцией СУММКВ. Для этого выделим ячейку D9 и выполним команду « /Математические/СУММКВ/ОК» и заполним открывшееся диалоговое окно (рис. 2.2); нажмем «ОК».

Рис. 2.2

  1. Теперь необходимо, изменяя А9:В9, минимизировать D9. Эту задачу оптимизации решим с помощью «Поиска решений». Выделим ячейку D9, выполним команду «Сервис/Поиск решения» и зададим сценарий решения (рис. 2.3).

Рис. 2.3

  1. По команде «Выполнить» получаем результаты поиска решения (рис. 2.4). Итак, искомая зависимость имеет вид: .

Рис. 2.4

  1. Выделяем диапазон А2:С6 и с помощью «Мастера диаграмм» строим точечную диаграмму со значениями, соединенными сглаживающими линиями без маркеров (команда « / Точечная / Вид 3/ Далее/ Далее /Далее / Готово»). На полученном рисунке для ряда В2:В6 делаем линию невидимой. Для этого стрелкой курсора компьютерной мыши укажем на соответствующей линии и щелкнем правой кнопкой. В открывшемся контекстном меню выберем «Формат рядов данных …», затем в открывшемся диалоговом окне «Формат ряда данных» выберем «Линия отсутствует» и «Маркер обычный». Нажмем «ОК» и получим рисунок 2.5.

Рис. 2.5

Задача 2.2

Для данных задачи 2.1 найти коэффициенты параболы , наилучшим образом аппроксимирующей эти данные по критерию наименьших квадратов. Построить диаграмму с исходными данными и приближающим их графиком параболы.

Решение

В этом случае сумма квадратов остатков является функцией параметров a, b, c : . С помощью «Поиска решений» подберем такие a, b, c, при которых значение S будет минимальным. По аналогии с задачей 2.1 выполним действия:

  1. Скопируем координаты точек ( ), i = 1, 2, 3, 4, 5 на новый рабочий лист.

  2. В ячейки А9:С9 вводим начальные значения коэффициентов a, b, c (рис. 2.6).

Рис. 2.6

  1. В диапазоне С2:С6 вычислим .

  2. В D2:D6 найдем остатки .

  3. В ячейку D9 введем формулу = СУММКВ(D2:D6).

  4. Выделим ячейку D9, выполним команду «Сервис/ Поиск решения» и поставим задачу минимизации D9 путем изменения А9:С9. Нажав кнопку «Выполнить», получим (рис. 2.7).

Рис. 2.7

  1. Искомая зависимость имеет вид: . Выделяем диапазон А2:С6, обращаемся к «Мастеру диаграмм» и строим диаграмму с исходными данными и приближающий их график параболы (рис. 2.8).

Рис. 2.8

Задачу нахождения линейной зависимости можно решить с помощью встроенной функции ЛИНЕЙН (известные_значения_y, известные_ значения_х, ИСТИНА, статистика). Два последние параметра – логические. Если последний аргумент статистика – ЛОЖЬ или опущен, то вычисляются только координаты k и b, а если ИСТИНА, то выдаются дополнительные статистические характеристики. Вместо ИСТИНА и ЛОЖЬ можно вводить 1 и 0.

Функция ЛИНЕЙН возвращает сразу несколько значений, поэтому формулу с этой функцией надо вводить как табличную. Для вывода полной статистики необходимо выделять диапозон из пяти строк и двух столбцов. Нажатие <F2> и <Ctrl> + <Shift> + <Enter> даст таблицу значений параметров:

k − угловой коэффициент

b − свободный член

− стандартная ошибка

− стандартная ошибка

− коэффициент детерминации

− стандартная ошибка по y

− наблюдаемое F-значение

Число степеней свободы

− сумма квадратов остатков

Коэффициент детерминации является характеристикой качества модели, он может принимать значения из промежутка [0;1]. Чем ближе к единице, тем лучше уравнение описывает зависимость. Заметим, что коэффициент имеет смысл рассматривать только при наличии свободного члена в уравнении. Для оценки качества выбранной модели также исследуют остатки. Если они носят регулярный характер, то функция выбрана неудачно, если же в поведении остатков нет ясно выраженной закономерности, то функция подобрана неплохо.

Пример 2.1

По данным задачи 2.1 с помощью встроенной функции ЛИНЕЙН найти прямую , наилучшим образом аппроксимирующую эти данные.

Решение

  1. Скопируем диапазон А2:В6 с исходными данными на новый рабочий лист.

  2. Выделим блок D2:E6 для вывода полной статистики и выполним команду « /Статистические/ ЛИНЕЙН / ОК», введем данные в открывшееся диалоговое окно (рис. 2.9).

Рис. 2.9

  1. Находясь в диалоговом окне не щелкаем по кнопке «ОК», а нажимаем <F2> и <Ctrl> + <Shift> + <Enter> ; получим таблицу (рис. 2.10).

Рис. 2.10

В первой строке таблицы записаны значения коэффициентов: k = 0,425, b = 1,175. В ячейке D4 находится коэффициент детерминации =0,976351, так как значение близко к единице, то уравнение , по-видимому, неплохо описывает зависимость y от x.

Замечание

Встроенной функцией ЛИНЕЙН можно решать задачи нахождения не только линейной, но и полиномиальной зависимости.

Пример 2.2

По данным задачи 2.1 с помощью встроенной функции ЛИНЕЙН найдем функцию наилучшим образом аппроксимирующую эти данные.

Решение

  1. Скопируем диапазон А2:В6 с координатами точек на новый рабочий лист.

  2. Переместим данные столбца В в столбец С.

  3. В ячейку В2 введем формулу = А2^2 и копируем ее в В3:В6.

  4. Выделим диапазон Е2:G6, откроем диалоговое окно ЛИНЕЙН и введем данные (рис. 2.11).

Рис. 2.11

  1. Нажимаем <F2>, затем <Ctrl> + <Shift> + <Enter> и получаем (рис. 2.12).

Рис. 2.12

Искомая зависимость имеет вид: . Коэффициент детерминации =0,996461 больше, а сумма квадратов погрешностей (находится в F6) меньше, чем в предыдущем (линейном) случае. Поэтому делаем вывод, что функциональная зависимость

лучше приближает данные.