
- •Введение
- •Структурная биоинформатика
- •Математика и физика в структурной биоинформатике
- •Уровни представления молекулярных систем
- •Уровень классической механики
- •Уровень статистической физики
- •Уровень квантовой механики
- •Квантовые расчеты: модели и методы
- •Полноатомное представление молекулярных систем: модели и методы
- •Силовое поле
- •Парциальные заряды
- •Силы Ван-дер-Ваальса
- •Учет влияния растворителя
- •Гидрофобные взаимодействия
- •Молекулярная динамика
- •Анализ нормальных мод
- •Моделирование Монте-Карло
- •Структура и сворачивание белка
- •Баланс энергии при сворачивании белка
- •Методы предсказания структуры белков
- •Восстановление путей сворачивания белка
- •Модели взаимодействия биомолекул
- •Системная биоинформатика
- •Исторический очерк математических методов в биологии
- •Иерархия объектов в системной биоинформатике
- •Основные понятия молекулярной биологии клетки
- •Молекулярные методы исследования клетки
- •Цели и направления при исследовании клетки
- •Анализ протеома клетки
- •Обработка экспериментов по секвенированию при изучении процессов в клетке
- •Дифференциальная экспрессия генов
- •Ошибки и погрешности при изучении экспрессии генов
- •Исследование систем регуляции в клетке
- •Аннотация и анализ публикаций
- •Подходы к автоматическому анализу текстов
- •Ошибки в аннотации, причины и механизмы их накопления
- •Обработка данных в медицине
- •Медицинские измерения и их интерпретация
- •Подходы к получению доказательств в медицине
- •Некоторые из терминов, относящихся к экономическим отношениям в фармацевтике
- •Некоторые из гипотез, рассматриваемые в современной медицине
- •Традиции медицины и их эволюция
- •Математические модели в биологии
- •Понятия из теории дифференциальных уравнений
- •Обзор и частные случаи прикладных моделей
- •Нейробиология и модели сетей нейронов
- •Модель сети нейронов с двумя типами возбуждения
- •Элементы теории фракталов
- •Биоразнообразие и модели распределения численности в экологии
- •Молекулярная филогенетика и метагеномика
- •Анализ микробных сообществ
- •Филогенетические деревья
- •Эволюция патогенов
- •Болезнь байкальской губки
- •Эволюция человека
- •Вместо заключения
- •Библиография
- •Структурная биоинформатика
- •Системная биоинформатика
81
Идентификацию и оценку количества мРНК сразу для большого количества генов возможно провести также с использование так называемых микрочипов (microarrays). В этой технологии, количество мРНК в биоматериале оценивается на основании степени гибридизации специфичных фрагментов ДНК в ячейках микрочипа. Ошибки и искажения в этом подходе, в целом, выше, чем при использовании секвенирования, и результаты экспериментов по двум технологиям непросто соотнести между собой. Но результат эксперимента в обоих подходах возможно свести к таблице, содержащей относительные значения содержания мРНК для каждого из выбранных генов.
Дифференциальная экспрессия генов
Традиционная и интуитивно простая постановка эксперимента по сравнению нескольких групп клеток или тканей может быть использована для определения генов, которые участвуют в регуляции биологических процессов, связанных с разделением использованных групп образцов. В экспериментах по измерению дифференциальной экспрессии, искомый набор генов возможно оценить по таблице, содержащей уровень экспрессии генов для каждого из образцов, с использованием моделей статистики.
Распределение генов по уровню экспрессии, полученное после обработки эксперимента, показано на рис. 3.18. Некоторые белки и соответствующие им гены представлены в клетке в большом количестве. Иллюстрации в разделе построены на основе обработки серии экспериментов по исследованию эпителия легких у больных бронхиальной астмой. И, в частности, белок ферритин, соответствующий гену FTL, оказавшимся одним из наиболее представленных генов в этом анализе, используются в клетке для накопления ионов железа.

82
Рис. 3.18: Распределение генов по уровню экспрессии
использовано представление "md-plot" (mean-di erence plot)
по вертикальной оси - относительное количество каждого из генов в образце, в логарифмических координатах по горизонтальной оси - количество гена в образце, по отношению к среднему его количеству в
серии образов, в логарифмических координатах.
данные из серии экспериментов с кодом PRJNA252605
Наиболее важная из целей, стоящих при обработке используемой серии экспериментов - связать изменение экспрессии генов с фактом заболевания. Вариации в среднем уровне экспрессии генов в двух группах исследованных тканей показано на рис. 3.18 как разброс точек по горизонтальной оси.
Для наиболее представленных генов, различие в среднем уровне экспрессии между группами невелико, как это показано в верхней части распределения на рис. 3.18. Но различие между отдельными образцами, внутри каждой из групп, для выбранных генов может быть существенным, как это показано на рис. 3.19. И, в результате, следует сделать вывод о том что, хоть экспрессия генов, выбранных как наиболее представленные, может существенно изменяться в отдельных образцах, эти изменения никак не связаны с фактом заболевания. Такого рода рассуждения используется как основание для количественных оценок вероятности связи уровня экспрессии гена с разделением между группами образцов.

83
Рис. 3.19: Гены с наибольшим уровнем экспрессии
использовано представление "тепловой карты" ("heatmap")
Достоверность связи экспрессии гена с разделением образов по группам лишь косвенно соотносится с различием в среднем уровне экспрессии в группах. Различие в среднем уровне экспрессии может быть случайным, если для гена характерно неоднородное распределение в образцах, независимо от их группировки. Но косвенное соответствие между достоверностью связи и усредненным различием уровня экспрессии проявляется в наличии двух пиков в представлении таблицы экспрессии, показанном на рис. 3.20.

84
Рис. 3.20: Схема определения различающихся генов
использовано представление "volcano chart"
На рис. 3.20 проиллюстрирован принцип выбора наиболее различающихся генов. Уровень экспрессии этих генов в каждом из образцов показан на рис. 3.21. Все эти гены представлены в клетке в относительно небольшом количестве. И, как обобщение опыта работы с данными такого рода, следует отметить, что наибольший интерес в сравнительном анализе представляют гены, которые представлены в среднем хоть и в малом количестве, но полностью отсутствующие в одной из групп.