- •Лабораторный практикум по математике
- •Учебно-методическое пособие
- •Лабораторная работа 1 Матрицы. Системы линейных уравнений
- •Задания к лабораторной работе 1
- •Продолжение табл. 1.1
- •Лабораторная работа 2 Метод наименьших квадратов
- •Задания к лабораторной работе 2
- •Лабораторная работа 3 Анализ временных рядов
- •Задания к лабораторной работе 3
- •Лабораторная работа 4 Дискретные распределения. Биномиальное распределение
- •Гипергеометрическое распределение
- •Задания к лабораторной работе 4
- •Лабораторная работа 5 Непрерывные распределения Нормальное распределение
- •Показательное распределение
- •Специальные законы распределения
- •Задания к лабораторной работе 5
- •Лабораторная работа 6 Вычисление определенного интеграла методом Монте-Карло
- •Задания к лабораторной работе 6
- •Лабораторная работа 7 Моделирование биномиального распределения и проверка качества модели критерием Пирсона
- •Пример выполнения задания
- •Задания к лабораторной работе 7
- •Лабораторная работа 8 Построение вариационных рядов и нахождение их числовых характеристик
- •Задания к лабораторной работе 8
- •Лабораторная работа 9 Проверка гипотезы о нормальном законе распределения генеральной совокупности критерием Пирсона
- •Задания к лабораторной работе 9
- •Лабораторная работа 10 Статистическая проверка гипотез о равенстве дисперсий и о равенстве средних
- •Задания к лабораторной работе 10
- •Библиографический список
- •Содержание
- •Лабораторный практикум по математике
Лабораторная работа 2 Метод наименьших квадратов
Решим задачу
подбора функциональной зависимости y
от x
по имеющимся измерениям или наблюдениям
(
),
(
),
…, (
).
Пусть F
– некоторый класс функций (например,
линейных или квадратичных, или степенных
и т.д.). Найдем функцию
из F
такую, чтобы ее значения
наилучшим образом приближали значения
.
Функцию f(x)
будем подбирать так, чтобы остатки
(погрешности)
по модулю были как можно меньшими.
Удобнее всего минимизировать сумму
квадратов остатков
.
В Excel предусмотрен мощный инструмент – «Поиск решения», который позволяет находить решение, при котором значение в определенной (целевой) ячейке рабочего листа достигает максимума или минимума. Целевая ячейка зависит от группы ячеек, которые называются изменяемыми ячейками. Их значения надо подобрать так, чтобы получить требуемый результат в целевой ячейке.
Если в меню «Сервис» отсутствует «Поиск решения», то необходимо выполнить команду «Сервис/Надстройки» и поставить галочку в окошке «Поиск решения».
Задача 2.1
Дан набор точек: (-2;0,5), (0;1), (1;1,5), (2;2), (4;3). Необходимо:
Методом наименьших квадратов найти коэффициенты k и b прямой линии
,
наилучшим образом приближающей
(аппроксимирующей) данные.В одной системе координат построить исходные данные и приближающую их прямую.
Решение
Ищем зависимость
в виде
.
В этом случае сумма квадратов остатков
является функцией k
и b:
.
Нужно найти такие значения параметров
k
и b,
при которых функция S
минимальна. Выполним следующие действия:
Введем координаты точек (
),
i
= 1, 2, 3, 4, 5 в диапазон А2:В6
(рис. 2.1).
Рис. 2.1
Начальные значения коэффициентов k = 0, b = 0 поместим в ячейки А9, В9 соответственно.
В диапазоне С2:С6 вычислим
.
Для этого в ячейку С2
введем формулу = $A$9*A2
+ $B$9
и копируем ее в С3:С6.Для нахождения остатков введем в D2 формулу = В2-С2 и копируем ее в D3:D6.
В D9 найдем S – сумму квадратов погрешностей, воспользовавшись встроенной функцией СУММКВ. Для этого выделим ячейку D9 и выполним команду « /Математические/СУММКВ/ОК» и заполним открывшееся диалоговое окно (рис. 2.2); нажмем «ОК».
Рис. 2.2
Теперь необходимо, изменяя А9:В9, минимизировать D9. Эту задачу оптимизации решим с помощью «Поиска решений». Выделим ячейку D9, выполним команду «Сервис/Поиск решения» и зададим сценарий решения (рис. 2.3).
Рис. 2.3
По команде «Выполнить» получаем результаты поиска решения (рис. 2.4). Итак, искомая зависимость имеет вид:
.
Рис. 2.4
Выделяем диапазон А2:С6 и с помощью «Мастера диаграмм» строим точечную диаграмму со значениями, соединенными сглаживающими линиями без маркеров (команда «
/
Точечная /
Вид 3/ Далее/ Далее /Далее / Готово»).
На полученном рисунке для ряда В2:В6
делаем линию невидимой. Для этого
стрелкой курсора компьютерной мыши
укажем на соответствующей линии и
щелкнем правой кнопкой. В открывшемся
контекстном меню выберем «Формат рядов
данных …», затем в открывшемся диалоговом
окне «Формат ряда данных» выберем
«Линия отсутствует» и «Маркер обычный».
Нажмем «ОК» и получим рисунок 2.5.
Рис. 2.5
Задача 2.2
Для данных задачи
2.1 найти коэффициенты параболы
,
наилучшим образом аппроксимирующей
эти данные по критерию наименьших
квадратов. Построить диаграмму с
исходными данными и приближающим их
графиком параболы.
Решение
В этом случае сумма
квадратов остатков является функцией
параметров a,
b,
c
:
.
С помощью «Поиска решений» подберем
такие a,
b,
c,
при которых значение S
будет минимальным. По аналогии с задачей
2.1 выполним действия:
Скопируем координаты точек ( ), i = 1, 2, 3, 4, 5 на новый рабочий лист.
В ячейки А9:С9 вводим начальные значения коэффициентов a, b, c (рис. 2.6).
Рис. 2.6
В диапазоне С2:С6 вычислим
.В D2:D6 найдем остатки .
В ячейку D9 введем формулу = СУММКВ(D2:D6).
Выделим ячейку D9, выполним команду «Сервис/ Поиск решения» и поставим задачу минимизации D9 путем изменения А9:С9. Нажав кнопку «Выполнить», получим (рис. 2.7).
Рис. 2.7
Искомая зависимость имеет вид:
.
Выделяем диапазон А2:С6,
обращаемся к «Мастеру диаграмм»
и строим диаграмму с исходными данными
и приближающий их график параболы
(рис. 2.8).
Рис. 2.8
Задачу нахождения линейной зависимости можно решить с помощью встроенной функции ЛИНЕЙН (известные_значения_y, известные_ значения_х, ИСТИНА, статистика). Два последние параметра – логические. Если последний аргумент статистика – ЛОЖЬ или опущен, то вычисляются только координаты k и b, а если ИСТИНА, то выдаются дополнительные статистические характеристики. Вместо ИСТИНА и ЛОЖЬ можно вводить 1 и 0.
Функция ЛИНЕЙН возвращает сразу несколько значений, поэтому формулу с этой функцией надо вводить как табличную. Для вывода полной статистики необходимо выделять диапозон из пяти строк и двух столбцов. Нажатие <F2> и <Ctrl> + <Shift> + <Enter> даст таблицу значений параметров:
k − угловой коэффициент |
b − свободный член |
|
|
|
|
|
Число степеней свободы |
|
|
Коэффициент детерминации является характеристикой качества модели, он может принимать значения из промежутка [0;1]. Чем ближе к единице, тем лучше уравнение описывает зависимость. Заметим, что коэффициент имеет смысл рассматривать только при наличии свободного члена в уравнении. Для оценки качества выбранной модели также исследуют остатки. Если они носят регулярный характер, то функция выбрана неудачно, если же в поведении остатков нет ясно выраженной закономерности, то функция подобрана неплохо.
Пример 2.1
По данным задачи
2.1 с помощью встроенной функции ЛИНЕЙН
найти прямую
,
наилучшим образом аппроксимирующую
эти данные.
Решение
Скопируем диапазон А2:В6 с исходными данными на новый рабочий лист.
Выделим блок D2:E6 для вывода полной статистики и выполним команду « /Статистические/ ЛИНЕЙН / ОК», введем данные в открывшееся диалоговое окно (рис. 2.9).
Рис. 2.9
Находясь в диалоговом окне не щелкаем по кнопке «ОК», а нажимаем <F2> и <Ctrl> + <Shift> + <Enter> ; получим таблицу (рис. 2.10).
Рис. 2.10
В первой строке таблицы записаны значения коэффициентов: k = 0,425, b = 1,175. В ячейке D4 находится коэффициент детерминации =0,976351, так как значение близко к единице, то уравнение , по-видимому, неплохо описывает зависимость y от x.
Замечание
Встроенной функцией ЛИНЕЙН можно решать задачи нахождения не только линейной, но и полиномиальной зависимости.
Пример 2.2
По данным задачи 2.1 с помощью встроенной функции ЛИНЕЙН найдем функцию наилучшим образом аппроксимирующую эти данные.
Решение
Скопируем диапазон А2:В6 с координатами точек на новый рабочий лист.
Переместим данные столбца В в столбец С.
В ячейку В2 введем формулу = А2^2 и копируем ее в В3:В6.
Выделим диапазон Е2:G6, откроем диалоговое окно ЛИНЕЙН и введем данные (рис. 2.11).
Рис. 2.11
Нажимаем <F2>, затем <Ctrl> + <Shift> + <Enter> и получаем (рис. 2.12).
Рис. 2.12
Искомая зависимость имеет вид: . Коэффициент детерминации =0,996461 больше, а сумма квадратов погрешностей (находится в F6) меньше, чем в предыдущем (линейном) случае. Поэтому делаем вывод, что функциональная зависимость
лучше приближает данные.

−
сумма квадратов
остатков