методичка_1 / гл5
.docГлава 5
Глава 5.
Метод наименьших квадратов (МНК)
для решения медико-биологических задач. Корреляция.
Откройте программу Excel. Если Вы выполняли задания по информатике раньше и сохранили свой файл, загрузите его. Задание выполняйте на новом листе. Введите его название: МНК, корреляция. В ячейку А1 введите дату выполнения работы, в ячейку А2 – факультет и номер группы, в ячейку А3 – фамилии студентов, выполняющих работу. В конце работы в названии файла укажите группу и фамилии студентов и сохраните файл.
Примечание. Данные для заданий 1-3 взяты из книги С.Гланца «Медико-биологическая статистика».
Задание 1. Для оценки эффективности полоскания зубов зубной налет оценивали визуально, а затем взвешивали
|
Визуальная оценка зубного налета, баллы |
Сухой вес зубного налета, мг |
|
25 |
2,7 |
|
32 |
1,2 |
|
45 |
2,7 |
|
60 |
2,1 |
|
60 |
3,5 |
|
65 |
2,8 |
|
68 |
3,7 |
|
78 |
8,9 |
|
80 |
5,8 |
|
83 |
4,0 |
|
100 |
5,1 |
|
110 |
5,1 |
|
120 |
4,8 |
|
125 |
5,8 |
|
140 |
11,7 |
|
143 |
8,5 |
|
143 |
11,1 |
|
145 |
7,1 |
|
148 |
14,2 |
|
153 |
12,2 |
Представить результат графически. Рассчитать коэффициент корреляции и построить аппроксимирующую линию (линию регрессии).
Внимание. При построении графиков следует пользоваться типом диаграммы: точечная. Именно этот тип диаграммы позволяет построить изображение в масштабе по обеим осям.
Выполнение задания.
Для расчета коэффициента корреляции используйте функцию коррел, в которой в массив 1 введите адреса ячеек, где содержится вес зубного налета, а в массив 2 – адреса ячеек, где введена оценка зубного налета в баллах (или наоборот).
Для построения линии регрессии «поставьте мышку» на экспериментальные точки на диаграмме и нажмите правую клавишу (см. рис. 5.1). Выберите Добавить линию тренда, на вкладке тип: в окне Построение линии тренда (аппроксимация и сглаживание) выберите линейная, на вкладке параметры – показывать уравнение на диаграмме.




Рис. 5.1
Задание 2. Используя уравнение регрессии из задания 1, рассчитайте, какой вес зубного налета соответствует 100 баллам и сколько баллов соответствует весу в 5 мг.
Выполнение задания.
Для решения задачи Вы можете использовать уравнение, показанное на диаграмме, но удобнее задать формулу (в отдельной ячейке), используя статистические функции Excel: НАКЛОН и ОТРЕЗОК. Линия регрессии имеет два параметра a и b: y = ax+b. Функция НАКЛОН возвращает наклон линии регрессии (т.е. коэффициент а в уравнении). Для этой функции надо указать массивы данных, например =НАКЛОН(B6:B25;A6:A25), что соответствует заданию y, затем x. Вызываем функцию с помощью значка fx. В открытом окне функции из позиции нужной строки можно задать массивы, выделяя их, удерживая левую клавишу мыши (рис. 5.2).







Рис. 5.2
Функция ОТРЕЗОК вычисляет точку пересечения линии регрессии с осью y (т.е. коэффициент b в уравнении y = ax+b).
Чтобы вычислить значения веса зубного налета, соответствующего 100 баллам, и количество баллов, соответствующего весу в 5 мг, можно поискать самостоятельно (в стандартных функциях Excel) функцию, подходящую для вычисления требуемых величин. Вы найдете, конечно, ПРЕДСКАЗ и правильно зададите для нее параметры: =ПРЕДСКАЗ(100;B6:B25;A6:A25) и
=ПРЕДСКАЗ(5;A6:A25;B6:B25).
Задание 3а. Исследовали влияние безникотиновых сигарет на работу сердца. Для каждого испытуемого (их было 12) с болезнью сердца измеряли продолжительность физической нагрузки до появления одышки. Тест проводился два раза: до курения безникотиновых сигарет и после. Результаты измерений представлены в задании 2а в теме «Описательная статистика». Рассчитайте коэффициент корреляции между продолжительностью физической нагрузки до курения безникотиновых сигарет и после. Связаны ли эти параметры между собой? Если связаны, то как?
Задание 3б. На тех же испытуемых исследовали влияние вдыхания окиси углерода на работу сердца. Проводили те же измерения до и после вдыхания окиси углерода. Результаты измерений представлены в задании 2б в теме «Описательная статистика». Рассчитайте коэффициент корреляции между продолжительностью физической нагрузки до и после вдыхания окиси углерода. Связаны ли эти величины между собой? Оцените эту зависимость по шкале: сильно, слабо, почти не связаны, нет зависимости одной от другой.
Задание 3в. В некотором исследовании у 22 собак измеряли среднее артериальное давление и диаметр коронарной артерии. Результаты измерений представлены в задании 3 в теме «Описательная статистика». Рассчитайте коэффициент корреляции между средним артериальным давлением и диаметром коронарной артерии для трех случаев:
для группы собак (11 собак), которым вводили лекарство Н;
для группы собак (11 собак), которым вводили физиологический раствор;
для всех собак вместе (22 собаки).
Связаны ли эти величины между собой? Оцените эту зависимость по шкале: сильно, средне, почти не связаны, нет зависимости одной от другой.
Задание 3в. В клинике Вашингтонского университета исследовали расходы пациентов на обследование и последующее лечение. У каждого врача (в исследовании участвовали 13 врачей) определили среднегодовые расходы одного пациента на обследование и среднегодовые расходы на лечение одного пациента. После этого врачей частично информировали о том, какие расходы несут пациенты их коллег, и снова определили расходы. Результаты исследования представлены в задании 4 в теме «Описательная статистика». Рассчитайте коэффициент корреляции между среднегодовыми расходами одного пациента на обследование и на лечение для двух случаев:
до информирования врачей о коллегах;
после информирования врачей о коллегах.
Связаны ли эти величины между собой? Если связаны, то как эту связь величин можно оценить?
Задание 4а. Даны результаты измерений роста и веса некоторой группы мужчин:
|
рост, см |
156 |
166 |
158 |
173 |
181 |
159 |
172 |
173 |
175 |
169 |
|
вес, кг |
62 |
64 |
61 |
70 |
94 |
65 |
76 |
95 |
69 |
71 |
Построить график с экспериментальными данными. Построить аппроксимирующую линию. Какой вес (в среднем) будет у мужчины с ростом 200 см? Связаны ли между собой вес и рост? Рассчитать коэффициент корреляции.
Задание 4б. Даны результаты измерений роста и веса некоторой группы мужчин:
|
рост, см |
156 |
166 |
158 |
177 |
191 |
159 |
172 |
186 |
165 |
169 |
|
вес, кг |
62 |
68 |
61 |
86 |
94 |
65 |
72 |
90 |
69 |
71 |
Построить график с экспериментальными данными. Построить аппроксимирующую линию. Какой вес (в среднем) будет у мужчины с ростом 190 см? Связаны ли между собой вес и рост? Рассчитать коэффициент корреляции.
Задание 4в. Даны результаты измерений роста и веса некоторой группы мужчин:
|
рост, см |
180 |
175 |
186 |
182 |
158 |
191 |
199 |
178 |
168 |
162 |
|
вес, кг |
80 |
80 |
82 |
92 |
77 |
97 |
103 |
75 |
70 |
71 |
Построить график с экспериментальными данными. Построить аппроксимирующую линию. Какой вес (в среднем) будет у мужчины с ростом 150 см? Связаны ли между собой вес и рост? Рассчитать коэффициент корреляции.
Задание 4г. Даны результаты измерений роста и веса некоторой группы мужчин:
|
рост, см |
156 |
178 |
158 |
177 |
191 |
163 |
172 |
186 |
165 |
169 |
|
вес, кг |
97 |
89 |
98 |
56 |
57 |
98 |
72 |
62 |
95 |
80 |
Построить график с экспериментальными данными. Построить аппроксимирующую линию. Какой вес (в среднем) будет у мужчины с ростом 180 см? Связаны ли между собой вес и рост? Рассчитать коэффициент корреляции.
Задание 4д. Даны результаты измерений роста и веса некоторой группы мужчин:
|
рост, см |
156 |
189 |
158 |
177 |
191 |
163 |
172 |
186 |
165 |
169 |
|
вес, кг |
96 |
73 |
87 |
61 |
56 |
78 |
72 |
65 |
74 |
80 |
Построить график с экспериментальными данными. Построить аппроксимирующую линию. Какой вес (в среднем) будет у мужчины с ростом 170 см? Связаны ли между собой вес и рост? Рассчитать коэффициент корреляции.
Задание 5а. Число заболевших гриппом за неделю представлено в таблице:
|
время, дни недели |
число заболевших гриппом, чел. |
|
понедельник |
15 |
|
вторник |
20 |
|
среда |
26 |
|
четверг |
31 |
|
пятница |
40 |
|
суббота |
43 |
|
воскресенье |
45 |
Найдите уравнение тренда. Дайте прогноз на количество заболевших в следующий понедельник. Представьте результаты графически.
Задание 5б. Уменьшение спроса на лабораторную технику за последние семь месяцев представлено в таблице:
|
время, месяцы |
спрос на лабораторную технику, шт. |
|
октябрь |
176 |
|
ноябрь |
167 |
|
декабрь |
150 |
|
январь |
140 |
|
февраль |
120 |
|
март |
111 |
|
апрель |
105 |
Найдите уравнение тренда. Дайте прогноз на спрос в мае. Представьте результаты графически.
Задание 5в. Рост цен на лабораторную технику за последние восемь месяцев представлен в таблице:
|
время, месяцы |
цены на лабораторную технику, у.е. |
|
август |
100 |
|
сентябрь |
103 |
|
октябрь |
105 |
|
ноябрь |
110 |
|
декабрь |
110 |
|
январь |
115 |
|
февраль |
118 |
|
март |
120 |
Найдите уравнение тренда. Дайте прогноз на цены в мае. Представьте результаты графически.
Окончание работы.
После выполнения заданий сохраните файл в папке ИНФОРМАТИКА. Лечебный факультет под именем, содержащим номер группы и фамилии тех, кто выполнял работу. Например, 92гр.Иванов,Петров
Контрольные вопросы к занятию по информатике:
Метод наименьших квадратов (МНК)
для решения медико-биологических задач. Корреляция.
-
Построение линии, аппроксимирующей экспериментальные данные методом наименьших квадратов.
-
Графики линейных функций y = a x + b в зависимости от значений параметров a и b.
-
Коэффициент корреляции. В каких пределах лежит эта величина? В каких случаях коэффициент корреляции равен -1, 0, 1? В каких случаях коэффициент корреляции отрицательный, положительный?
1. Морозов Ю.В. Основы высшей математики и статистики. М. Медицина 1998 С.151-163
2. Антонов В.Ф и др. Физика и биофизика. Практикум 2008 стр.34-38
