Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции: геномика и протеомика.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
565.76 Кб
Скачать
  1. Функциональная геномика и биоинформатика

По состоянию на декабрь 2007 г. определены уточненные размеры разных геномов: геном человека содержит 31 897 генов, у дрожжей 7547 генов, у резушки Таля (Arabidopsis thaliana) имеется 29 388 ORF, у круглого червя (Caenorhabditis elegans) 23 399 генов, а геном мыши содержит генов на 6 тыс. больше по сравнению с геномом человека (Goodaсrе, 2007; http://eugenes.org/). Знание размера усредненного варианта человеческого генома, по образному выражению Л. Л. Киселева (Киселев, 2004), можно сравнить лишь с самым общим описанием конструкции автомобиля, включающей мотор, ходовую часть, колеса, руль, сиденья, обивку, бензин с маслом. Это описание не дает понимания взаимодействия частей и возможности управления автомобилем. Так же и геномика в настоящее время меняет свою ориентацию и осуществляет переход от структурной геномики к функциональной, основной задачей которой является «прочитать геном», установить как управляются и работают гены. Для этого потребуются еще десятилетия. Наступившая эпоха постгеномики стала эрой функциональной геномики и биоинформатики, а ее ключевыми словами — «белок» и «протеом» (вместо «ДНК» и «геном»).

Функциональная геномика использует математические методы для предсказания локализации гена или регуляторного участка в нуклеотидной последовательности. Биоинформатика дает об этом исходную информацию с вероятностью правильного предсказания около 85 %. Наличие предсказанного гена затем проверяется экспериментально: предполагаемый участок гена «вырезается» из ДНК и проверяется, кодирует ли он синтез белковой молекулы. В современных базах данных сосредоточена информация о нескольких миллиардах пар нуклеотидов (геномов) и аминокислотной последовательности белков у человека и других живых организмов. Компьютерная программа профессора Н. А. Колчанова (Институт цитологии и генетики СО РАН) позволяет разобраться в это океане информации и находить начала генов, их окончания и регуляторные участки. Другие программы — М. А. Ройтберга (Roytberg, 1992), а также М. С. Гельфанда и А. А. Миронова (Гельфанд, 1998) — осуществляют поиск собственно генов, то есть расшифровывают нуклеотидные последовательности.

Изменчивость набора белков организма — его протеома зависит от двух процессов: во-первых, на каждой стадии онтогенеза функционируют разные части генома; во-вторых, большая часть транскриптов РНК у человека и высших организмов претерпевают альтернативный сплайсинг. При этом несколько экзонов, содержащихся в пре-мРНК, могут объединяться в разных комбинациях с образованием различных мРНК. Это создает возможность синтеза разных белков на базе одной кодирующей последовательности (гена).

Если в гене имеется N интронов, то в ходе сплайсинга происходит N стадий вырезания интронов и сшивания экзонов. При этом экзоны одного гена могут стыковаться в разной последовательности, а некоторые экзоны могут удаляться вместе с соседними интронами. В результате этих событий один и тот же ген может кодировать целое семейство генов, сходных, но функционально разных. Имеются данные, что один ген может кодировать до 40 тыс. генов (Modrek, Lee, 2002). Это удивительное явление иллюстрируют два примера.

Ген дрозофилы содержит 95 альтернативных экзона. Он кодирует один из белков рецептора аксона. За счет альтернативного сплайсинга этого гена может образовываться 38 016 различных мРНК.

Ген slo у человека регулирует работу внутреннего уха. Белок этого гена присутствует в ворсинках, которые отвечают за распознавание высоты звука. Он содержит 35 экзонов, 8 из которых могут присутствовать или отсутствовать в зрелой мРНК. Возможное число вариантов сплайсинга равно 8! =40 320 (8! читается математически 8-факториал). Из этих вариантов экспериментально идентифицировано 500. Существование других пока не установлено: ведь природа может не реализовывать все возможные варианты. При данном множественном сплайсинге разные типы волосяных клеток внутреннего уха реагируют на звуки разных частот от 20 до 20 тыс. герц. Различия клеток в восприятии частоты определяется свойствами альтернативных сплайс-форм гена slo.

Экспериментально показано, что у человека 74 % генов работают с использованием альтернативного сплайсинга, а возможность продуцирования различных белков оценивается равной 106= 1 миллион (Oh et al., 2004). Выделить и охарактеризовать все эти белки невозможно. Нуклеотидная последовательность гена человека и эукариот не дает точной информации о том, какой белок он кодирует. Современное определение понятия «ген эукариот» можно представить в следующей формулировке (Киселев, 2004):

  • это длинная, случайная, не кодирующая последовательность нуклеотидов, в которой расположены экзоны. способные после вырезания из транскрипта этого гена и их объединения в строго определенной очередности кодировать определенную функцию.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]