Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математические методы в биологии.doc
Скачиваний:
40
Добавлен:
13.11.2019
Размер:
2.49 Mб
Скачать

Вопросы для самопроверки:

  1. Объясните значения фраз «высокая положительная корреляция» и «низкая отрицательная корреляция». Приведите примеры и графики, иллюстрирующие эти понятия.

  2. Сформулируйте в содержательных понятиях задачу из области специализации, при решении которой необходимо вычислять: коэффициент корреляции Пирсона, коэффициент корреляции Спирмена, коэффициент взаимной сопряженности.

  3. Перечислите причины появления ложной корреляции.

  4. Объясните смысл коэффициента ранговой корреляции?

  5. Может ли коэффициент корреляции быть равным нулю, когда между измеряемыми признаками наблюдается функциональная зависимость?

  6. Приведите примеры, когда нулевая корреляция предполагает независимость и когда нулевая корреляция такой зависимости не предполагает?

Регрессионный анализ

Довольно часто в практике исследовательской работы имеет место ситуация, когда важнейшие переменные, описывающие некоторый процесс, известны заранее, но модель процесса еще не известна. В этом случае возможны разные подходы. Одним из них является построение эмпирических моделей.

Построение эмпирических моделей предполагает проведение экспериментов или наблюдений для сбора опытных данных, выбор одной определенной модели из некоторого множества возможных, вычисление коэффициентов модели («подгонку») и оценку полученных результатов.

Число цветков при разном количестве неорганического брома в почве.

Кол-во брома (мкг/см3)

2

4

6

8

10

12

14

Среднее число цветков

3,6

2,9

3,2

1,8

2,3

1,7

0,8

Метод наименьших квадратов

Метод наименьших квадратов, разработанный знаменитыми математиками К. Гауссом и А. Лежандром, берет свое начало от задач геодезии и астрономии. Рассмотрим его существо на примере линейной модели. Итак, пусть для представления полученных данных мы выбрали линейную модель y*=a+bx, где х – независимая переменная, т. е., переменная, которую экспериментатор может менять по своему усмотрению; y* - зависимая переменная или отклик; a и b – коэффициенты (параметры). Из данных, приведенных в примере, видно, что именно такой моделью (уравнением прямой линии) может быть описана зависимость.

С другой стороны, видно что реально наблюдаемые значения отклика yi несколько отличаются от откликов yi*, соответствующих уравнению модели. И такое положение будет всегда, даже в тех случаях, когда зависимая и независимая переменные будут связаны строгой функциональной зависимостью. В этом случае отклонения эмпирических значений от теоретических связаны с погрешностями измерений, которые всегда имеют место.

Итак, каждому значению независимой переменной в общем случае соответствует ошибка: i=yi-yi*.

Естественно, что в зависимости от того, как будет проведена прямая, аппроксимирующая набор экспериментальных данных, величины i будут различны. Именно, для того, чтобы избежать субъективности при построении эмпирической модели, и был разработан метод наименьших квадратов, позволяющий однозначно определить параметры выбранной модели. В основе этого метода лежит критерий минимизации суммы квадратов ошибок, т. е. требование, чтобы была минимальной.

Покажем, как используется метод наименьших квадратов на примере оценки параметров для уравнения y*=a+bx.

В общем случае необходимо решить систему уравнений:

, из которых находятся коэффициенты a и b.

Подставляя данные из примера, получаем:

16,3=7a+56b

107=56a+560b

Откуда a=4, b=-0,209.

В таблице приведено сравнение между реальными и теоретическими данными, а также величины ошибок.

Y

3,6

2,9

3,2

1,8

2,3

1,7

0,8

y*

3,582

3,164

2,746

2,328

1,91

1,492

1,074

i

0,018

-0,264

0,454

-0,528

0,39

0,208

-0,274

Сумма i

0,825