Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Феранчук С.И. Биоинформатика. Обсуждение задач, подходов и методов.pdf
Скачиваний:
152
Добавлен:
16.09.2020
Размер:
60.84 Mб
Скачать

81

Идентификацию и оценку количества мРНК сразу для большого количества генов возможно провести также с использование так называемых микрочипов (microarrays). В этой технологии, количество мРНК в биоматериале оценивается на основании степени гибридизации специфичных фрагментов ДНК в ячейках микрочипа. Ошибки и искажения в этом подходе, в целом, выше, чем при использовании секвенирования, и результаты экспериментов по двум технологиям непросто соотнести между собой. Но результат эксперимента в обоих подходах возможно свести к таблице, содержащей относительные значения содержания мРНК для каждого из выбранных генов.

Дифференциальная экспрессия генов

Традиционная и интуитивно простая постановка эксперимента по сравнению нескольких групп клеток или тканей может быть использована для определения генов, которые участвуют в регуляции биологических процессов, связанных с разделением использованных групп образцов. В экспериментах по измерению дифференциальной экспрессии, искомый набор генов возможно оценить по таблице, содержащей уровень экспрессии генов для каждого из образцов, с использованием моделей статистики.

Распределение генов по уровню экспрессии, полученное после обработки эксперимента, показано на рис. 3.18. Некоторые белки и соответствующие им гены представлены в клетке в большом количестве. Иллюстрации в разделе построены на основе обработки серии экспериментов по исследованию эпителия легких у больных бронхиальной астмой. И, в частности, белок ферритин, соответствующий гену FTL, оказавшимся одним из наиболее представленных генов в этом анализе, используются в клетке для накопления ионов железа.

82

Рис. 3.18: Распределение генов по уровню экспрессии

использовано представление "md-plot" (mean-di erence plot)

по вертикальной оси - относительное количество каждого из генов в образце, в логарифмических координатах по горизонтальной оси - количество гена в образце, по отношению к среднему его количеству в

серии образов, в логарифмических координатах.

данные из серии экспериментов с кодом PRJNA252605

Наиболее важная из целей, стоящих при обработке используемой серии экспериментов - связать изменение экспрессии генов с фактом заболевания. Вариации в среднем уровне экспрессии генов в двух группах исследованных тканей показано на рис. 3.18 как разброс точек по горизонтальной оси.

Для наиболее представленных генов, различие в среднем уровне экспрессии между группами невелико, как это показано в верхней части распределения на рис. 3.18. Но различие между отдельными образцами, внутри каждой из групп, для выбранных генов может быть существенным, как это показано на рис. 3.19. И, в результате, следует сделать вывод о том что, хоть экспрессия генов, выбранных как наиболее представленные, может существенно изменяться в отдельных образцах, эти изменения никак не связаны с фактом заболевания. Такого рода рассуждения используется как основание для количественных оценок вероятности связи уровня экспрессии гена с разделением между группами образцов.

83

Рис. 3.19: Гены с наибольшим уровнем экспрессии

использовано представление "тепловой карты" ("heatmap")

Достоверность связи экспрессии гена с разделением образов по группам лишь косвенно соотносится с различием в среднем уровне экспрессии в группах. Различие в среднем уровне экспрессии может быть случайным, если для гена характерно неоднородное распределение в образцах, независимо от их группировки. Но косвенное соответствие между достоверностью связи и усредненным различием уровня экспрессии проявляется в наличии двух пиков в представлении таблицы экспрессии, показанном на рис. 3.20.

84

Рис. 3.20: Схема определения различающихся генов

использовано представление "volcano chart"

На рис. 3.20 проиллюстрирован принцип выбора наиболее различающихся генов. Уровень экспрессии этих генов в каждом из образцов показан на рис. 3.21. Все эти гены представлены в клетке в относительно небольшом количестве. И, как обобщение опыта работы с данными такого рода, следует отметить, что наибольший интерес в сравнительном анализе представляют гены, которые представлены в среднем хоть и в малом количестве, но полностью отсутствующие в одной из групп.