Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

00 Учебное пособие по курсу биометрия

...pdf
Скачиваний:
179
Добавлен:
02.02.2015
Размер:
4.12 Mб
Скачать

Анализ контуров эффективности криоконсервирования эмбрионов мыши показывает, что совместное изменение концентрации криопротектора и режима охлаждения оказывает значимое влияние на сохранность биообъекта. Влияние режима охлаждения отражает коэффициент «крутизны» равный 63 у.е., а изменение концентрации глицерина в два раза ниже - 26 у.е. Приблизительно такие же величины получены для показателей, отражающих силу влияния данных факторов на эффективность выбранного способа криоконсервирования 71 и 18 % соответственно.

Сохранность деконсервированных эмбрионов мыши 87,5 8,3 % полученная при линейных N=0 и не линейных N=1, N=2 режимах замораживания (табл. 9), согласуется с данными 80 ÷ 90 % представленными в литературе [26]. Эффективность режимов замораживания составляет 96 ÷ 98 %. Полученные данные показывают, что однофакторный поиск концентрации криопротектора, режима замораживания, конечной температуры охлаждения биообъекта и времени выдержки перед погружением его в жидкий азот, обеспечивает такие же значения, как и при использовании многофакторной оптимизации.

Таким образом, многофакторная оптимизация режима замораживания эмбрионов мыши дала возможность определить допустимый диапазон изменения скорости охлаждения 0,3 ÷ 0,6 0С/мин в температурном диапазоне от -5 до -25 0С, что позволило реализовать показатель жизнеспособности деконсервированных эмбрионов мыши на уровне 83,3 %.

ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ.

1.Опишите особенности методов однофакторной оптимизации исследования

2.Какова необходимость выделения существенных факторов?

3.Охарактеризуйте методы случайного поиска в задачах экспериментальной оптимизации биотехнологических параметров.

4.Каковы особенности применения метода покоординатного спуска (Гаусса-Зейделя)?

5.Каковы особенности применения метода Розенброка?

6.Какова необходимость проведения многофакторного эксперимента?

7.Дайте сравнительный анализ существующих методов многофакторной оптимизации исследования.

8.Каковы особенности применения метода оптимизации Genetic Algorithms?

9.Как осуществляется исследование поверхности отклика на основе уравнений регрессии второго порядка?

10.Каков порядок проведения оптимизация проведения многофакторного биологического эксперимента векторным методом?

11.Опишите принцип графического нахождения оптимума для двухфакторного эксперимента.

181

Глава 6 Математическое моделирование как инструмент научного исследования

6.1 Влияние космофизических факторов на случайные процессы исследованные С.Э.Шнолем.

В 1951-1956 г.г. С.Э.Шноль исследуя «разброс результатов» измерения скорости гидролиза АТФ, катализируемой белками актомиозинового комплекса, установил, что параллельные опыты имеют расхождение до 1,5%, а последовательные во времени до 24% [34].

Проведенные исследования в течении 50 лет дали возможность автору определить:

1 «Разброс результатов измерений» свойственен процессам любой природы от биохимических реакций до радиоактивного распада. На рис. 1 представлены спонтанные изменения ферментативной активности в растворе актомиозина, в последовательных пробах. Среднеквадратичная амплитуда «разброса результатов» в % к средней величине равна 23% (коэффициент вариации).

Рис. 1. Изменения АТФ - азной активности в растворе актомиозина. По оси абсцисс – номера 15 секундных интервалов между пробами. По оси ординат – ферментативная (АТФ-азная) активность, в условных единицах [34].

2 Величина разброса относительно измеряемой величины различна для процессов разной природы.

3 Форма гистограмм в одно и то же время, в данном географическом пункте сходна для любых процессов.

На рисунке 2 отражены гистограммы сходной «идеи формы» наблюдаемые при измерениях креатинкиназой и реакции аскорбиновой кислоты (АК) с дихлорфенолиндофенолом (ДХФИФ).

182

Рис 2. Сходства формы гистограмм в опытах с АК + ДХФИФ трипсином и креотинкиназой. По оси ординат число проб с данной активностью [34].

3 Форма гистограмм закономерно изменяется во времени и эти изменения определяются космофизи-

ческими факторами.

На рисунке 3 представлена иллюстрация синхронного изменения титра SH - групп в разных порциях раствора актина в течении нескольких минут.

Детальный анализ амплитуды флуктуаций реакций в зависимости от времени суток «разброса результатов» измерений скорости реакции АК+ДХФИФ среднеквадратического отклонения σ после нормировки (коэффициент вариации). Каждая точка величины среднеквадратического отклонения амплитуды на графике была вычислена по 1200-1500 измерениям.

Рис. 3. Изменение титра SH - групп в растворе актина. По оси абсцисс – время. По оси ординат – титр в мл 1,25*10-4 раствора AgNO3 [34].

Сравнение зависимости от времени суток амплитуды «разброса результатов» измерений скорости реакции АК+ДХФИФ (σ) и проявлений 11 видов заболеваний человека (рис. 4 данные Л.Я. Глыбина).

183

Рис. 4. N – ве-

роятность появления заболевания, А

– амплитуда «макроскопических

флуктуаций» [34].

Обработка и представление результатов измерений с 1986 по 1992 г.г. альфа активности препарата 239Рu,

включающих 60000 измерений, в виде гистограмм (рис. 5) показала наибольшую вероятность сходства ближайших соседей «эффект ближней зоны» и четкую околосуточную периодичность появления сходных гистограмм.

Рис 5. Зависимость вероятности повторного появления гистограмм, построенных по результатам измерений альфа-активности 239Рu, от величины разделяющего их интервала времени. По абсциссе – интервалы времени (часы). По ординате – число сходных пар, соответствующее данной величине интервала [34].

На рис. 6 видна корреляция изменений содержания гемоглобина крови и отклонения движения Луны по кеплеровской орбите - λ. Аналогичные картины получены для скорости реакции окисления унитиола (метод В.В. Соколовского), скорость оседания эритроцитов, флуктуаций «компьютерного времени» и

ряда других показателей.

Рис 6. Изменение содержания гемоглобина в крови (автора исследования) при ежедневном измерении с 1 июня по 31 октября 2002 г. в условиях антарктической

184

экспедиции в сопоставлении с изменениями λ [34].

В центре рисунка 7 Солнце, вращающееся против часовой стрелки с около 27 – суточным периодом. По околосуточной орбите, так же против часовой стрелки, совершает годичный путь Земля. Сторона Земли, обращенная к Солнцу – день. Противоположная сторона (заштрихованная) – ночь. Земля, также против часовой стрелки, вращается вокруг своей оси. Поперек рисунка изображена линия равноденствий. Сверху вниз косыми линиями изображено (условное) направление движения Солнечной системы в Галактике.

Отклонение истинного движения Луны от движения по законам Иоганна Кеплера, вызываемое воздействием Солнца называется эвекцией. Смысл эвекции состоит в периодическом изменении формы лунной орбиты, т.е. в возрастании и уменьшении эксцентриситета орбиты Луны. Данный эффект обусловлен гравитационным воздействием Солнца на Луну. Из совокупности полученных результатов автором сделан вывод - разброс значений измеряемых ве-

личин является следствием флуктуаций пространствавремени.

Рис 7. Вращение земли вокруг своей оси и Солнца относительно движения Солнечной системы в Галактике

Таким образом, причиной низкой воспроизводимости результатов последовательных измерений является исследованный С.Э. Шнолем эффект «макроскопических флуктуаций», который выражается в зависимости периодичности изменений исследуемых явлений: суточных, месячных и годовых. Следовательно, альтернативой усреднения результатов последовательных измерений является применение методов математического моделирования процессов имеющих колебательный характер.

Во многих учебниках колебательный характер исследуемых изменений приводят как подтверждение гипотез, положенных в основу модели Вольтерра [31]. На рис. 8. представлены кривые колебаний численности пушных зверей по данным компании Гудзонова залива о числе заготовленных шкурок. Действительно, периоды колебаний численности зайцев (жертв) и рысей (хищников) примерно одинаковы и составляют около 9 – 10 лет. При этом максимум численности зайцев опережает, как правило, максимум численности рысей на один год. Наблюдаются регулярные колебания, осложненные случайными факторами, связанными с погодой и проч.

Модель взаимодействия видов предложена В. Вольтерра в тридцатые годы XX века для объяснения периодических изменений числа особей, так называемую модель «хищник-жертва». Обозначив число зайцев (жертв) x, а число вол-

185

Рис. 9. Фазовый портрет системы
(рис. 8). Параметры системы: x = 4,
xy= 0,3, y = yx = 0,4

ков (хищников) y. Зайцы размножаются со скоростью, пропорциональной их числу εхх. Убыль зайцев пропорциональна вероятности встречи с волком и наоборот число волков нарастает тем быстрее, чем чаще происходят их встречи с зайцами, т.е. пропорциональна произведению численностей xy. Кроме того, имеет место процесс естественной смертности волков, причем скорость

смертности пропорциональна их количеству.

Рис. 8. Кривые численности зайца и рыси в Канаде.

Эти рассуждения приводят к системе уравнений для изменений численности зайцев и волков:

 

dx

x(

 

 

 

 

y),

 

 

 

 

x

xy

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dy

y(

 

 

 

 

x).

 

 

y

yx

 

dt

 

 

 

 

(1)

 

 

 

 

 

 

 

Где: εх,, εу, γх,, γу - параметры системы.

Анализ системы (1) показывает, что траектории вблизи особой точки являются концентрическими эллипсами, а сама особая точка – центром (рис 9).

Рассматриваемая модель Вольтерра имеет замкнутые траектории и определяется параметрами системы. Изменения численности жертвы и хищника во времени представляют собой колебания, причем колебания численности хищника отстают по фазе от колебаний жертв. В момент, когда точка находится в положении М1, в систему добавляется извне некоторое число особей y такое, что изображающая точка переходит скачком из точки M1 в точку M2. Если после этого систему предоставить самой себе, колебания x(t), y(t) уже будут происходить

с большими амплитудами, чем прежде, и изображающая точка будет двигаться по траектории 2. Это и означает, что колебания в системе неустойчивы: они навсегда изменяют свои характеристики при внешнем воздействии.

Система имеет особую точку – устойчивый фокус, узел рис. 10.

186

Рис. 10. Фазовый портрет системы. Где: а

– устойчивый фокус, параметры системы: x = 2, xy = 18, x=1, y = 3, yx = 5, y=1, б

устойчивый узел, x = 2, xy = 1, x=1, y = 3, yx = 1, y=1

Таким образом, применение математического моделирования дает возможность достаточно точно определить текущее значение и существенно снизить многократный разброс результатов полученных в разные временные периоды (от 20 до 150 тысяч шкурок зайцев полученных в год).

В месте с тем остается открытый вопрос: «Что делать в случае, когда нет математической модели»?

Традиционный подход основан на сравнении результатов полученных параллельно в контроле и опыте. Разница данных величин определяет абсолютную погрешность. Величина относительной погрешности дает возможность количественно сравнивать величины, имеющие разные размерности. Относительные величины являются основой проведения корреляционного, регрессионного, дисперсионного и других видов статистического анализа. Примеры применения критериев Стьюдента - t и Фишера - F.

Следовательно, для сравнения результатов полученных последовательно (при разных условиях) рекомендуется применять относительные показатели.

Рабочая гипотеза решения проблемы не сопоставимости последовательно полученных результатов измерений заключается в применении относительных показателей полученных в контроле и опыте. Отношение параллельно полученных величин в контроле и опыте дает возможность сравнивать результаты, полученные в последовательно проведенных измерениях.

6.2 Уникальные возможности Data Mining

Сам термин Data Mining переводится как "извлечение информации" или "добыча данных". Нередко рядом с Data Mining встречаются слова knowledge discovery - "обнаружение знаний" и Data Warehouse - "хранилище данных". Возникновение указанных терминов, которые являются неотъемлемой частью Data Mining, связано с новым витком в развитии средств и методов обработки и хранения данных. Она оперирует усредненными характеристиками выборки, которые часто являются фиктивными величинами (средней жизнеспособностью биообъекта, когда в зависимости от выбора технологии или качества биообъекта, нам необходимо уметь прогнозировать состояние деконсервированного объекта;

187

средней эффективности технологии, тогда как нам интересны характерные особенности отдельных еѐ этапов и т.д.).

Цель Data Mining состоит в выявлении скрытых закономерностей в полученных данных, образно говоря, в "нахождении золотых песчинок в огромной куче руды". Дело в том, что человеческий разум сам по себе не приспособлен для восприятия больших массивов разнородной информации. В среднем человек, за исключением некоторых индивидуумов, не способен улавливать более двух-трех взаимосвязей даже в небольших выборках. Но и традиционная статистика, долгое время претендовавшая на роль основного инструмента анализа данных, также нередко пасует при решении задач из реальной жизни. Поэтому методы математической статистики оказываются полезными главным образом для проверки заранее сформулированных гипотез, тогда как определение гипотезы иногда бывает достаточно сложной и трудоемкой задачей. Современные технологии Data Mining перелопачивают информацию с целью автоматического поиска шаблонов (паттернов), характерных для каких-либо фрагментов неоднородных многомерных данных. В отличие от оперативной аналитической обработки данных (OLAP) в Data Mining бремя формулировки гипотез и выявления необычных (unexpected) шаблонов переложено с человека на компьютер. Data Mining – это не один, а совокупность большого числа различных методов обнаружения знаний. Выбор метода часто зависит от типа имеющихся данных и от того, какую информацию вы пытаетесь получить. Сфера применения Data Mining ничем не ограничена он нужен везде, где имеются какие-либо данные. Опыт многих таких предприятий показывает, что отдача от использования Data Mining может достигать 1000 %. Например, известны сообщения об экономическом эффекте, в 10 ÷ 70 раз превысившем первоначальные затраты от 350 до 750 тыс. дол. Приводятся сведения о проекте в 20 млн. дол., который окупился всего за 4 месяца. Другой пример – годовая экономия 700 тыс. дол. за счет внедрения Data Mining в сети универсамов в Великобритании. Data Mining представляют большую ценность для руководителей и аналитиков в их повседневной деятельности. Деловые люди осознали, что с помощью методов Data Mining они могут получить ощутимые преимущества в конкурентной борьбе.

Компанией StatSoft была разработана система STATISTICA Data Miner, которая спроектирована и реализована как универсальное и всестороннее средство анализа данных – от взаимодействия с различными базами данных до создания готовых отчетов, реализующее так называемый графически – ориентированный подход.

Data Mining включает огромный набор различных аналитических процедур, что делает его недоступным для обычных пользователей, которые слабо разбираются в методах анализа данных. (Дюк В., "Data Mining состояние, про-

блемы, новые решения", http://on.wplus.net/sparm/science/Data mining.html, 1999)

К сожалению научных работ, в области биологии, с применением программ Data Mining, пока еще нет по следующим причинам: инерционность мышления исследователей, множество взаимосвязанных параметров и высокий коэффициент их вариации, отсутствие баз данных.

188

Методы измерения
Объект исследования
Методы структурирования полученных данных
Результаты исследования Рис. 1.25. Методы исследования.

6.1.1 Сценарный подход в исследовании

Для повышения эффективности научного исследования следует применять сценарный подход, обеспечивающий требуемую надежность результатов анализируемой информации (Data Mining). Под сценарностью понимается применение ряда методов проведения параллельных измерений и их обработки (рис 1.25). При правильной организации эксперимента параллельность измерения и обработки результатов является основой объективности полученной информации вследствие еѐ дополнения. Достоверность результатов научного исследования пропорциональна количеству методов, как измерения, так и обработки (структурирования) полученных данных. Основными этапами структурирования информации являются анализ, оптимизация и графическое представление поверхности отклика.

Проведенный анализ литературы показывает, что на результаты решения криобиологической задачи оказывает влияние множество факторов. Экспериментальное изучение механизмов протекания всех этих явлений крайне сложны в реализации. Между тем задачи анализа и оптимизации этих процессов необходимо решать. Для этих целей успешно применя-

ются экспериментально статистические методы, с помощью которых строится математическая модель объекта и изучается зависимость отклика системы на изменения варьируемых параметров.

Отсутствие обратной связи при проведении исследования, также является важным препятствием использования существующих способов многофакторной оптимизации, что выражается в возможности получения графических представлений отражающих взаимосвязь интересуемых нас параметров, как при проведении эксперимента, так и при анализе полученных результатов. Тем самым теряется возможность отслеживания механизма причинно-следственных связей, являющегося основой построения аналитической модели. Вместе с тем, существенным недостатком общепринятых методов оптимизации исследования является их специфичность, то есть пригодность для определенных областей исследования – решение химических и физических задач. Для исследования биологических объектов существует необходимость создания способа оптимизации, совмещающего достоинства существующих методов и снижающего их недостатки, что позволит ускорить процесс решение криобиологических задач связанных с большим расходом биообъекта и возникающими с этим проблемами как этического, так и экономического характера.

Следующей проблемой является ограниченность совместного применения методов многофакторного анализа и оптимизации в комплексе. Что приводит к необходимости раздельного проведения нескольких повторяющихся опытов.

189

Хотя, методы оптимизации, основанные на регрессионном анализе, позволяют проводить проверку значимости параметров, однако при большом коэффициенте вариации оптимизируемых параметров они оказываются практически неприемлемыми для этих целей. Такие же трудности возникают при необходимости установления не только значимых факторов, но и их всевозможных комбинаций. Поэтому для определения факторов оказывающих существенное влияние на целевую функцию рекомендуется предварительно использовать дисперсионный анализ с последующим проведением оптимизации выявленных параметров [3, 4,

23, 24, 44 ÷ 49, 61, 81, 82, 85, 87, 90, 96, 112].

Вместе с тем существующие методы многофакторного исследования, как правило, оказываются не применимыми на этапе проведения поисковых опытов. Это зачастую приводит исследователя к отрицательным результатам после выполнения комплекса работ связанных с поэтапным осуществлением многофакторного анализа и оптимизации. В связи с этим существует необходимость разработки алгоритма объединяющего методы многофакторного анализа и оптимизации, с графическим представлением поверхности отклика, работающего на этапе проведения поисковых опытов.

Таким образом, на вероятность получения полноценного потомства от деконсервированных черенков плодово-ягодных культур, спермиев и эмбрионов животных оказывает влияние их начальное состояние и эффективность применяемого способа криоконсервирования. Следовательно, воспроизводимость результатов сохранности биообъекта зависит от вариации его исходного состояния и эффективности выбранного способа криоконсервирования и его составляющих этапов. Для учета взаимосвязи изучаемых параметров криоконсервирования биообъекта рекомендуется комплексно применять градиентные методы оптимизации и дисперсионного анализа на основе реализации относительных величин изменения сохранности биообъекта.

Например, для исследования гетерогенности биологического объекта общая структура исследования разделена на три части – изучение начального состояния, анализ разных методов криоконсервирования и приведение полученных результатов к одинаковым условиям измерения (рис 2). Для изучения неоднородности используют биообъект, имеющий разное начальное состояние. Во второй части, определяют эффективность различных способов криоконсервирования биообъекта замороженного при низких, высоких и сверхвысоких скоростях. Для этого устанавливают этапы, имеющие низкую эффективность, и проводят оптимизацию их параметров по результатам развития биообъекта в условиях in vitro.

190