
- •Лекция 1 Становление геномики как самостоятельного раздела молекулярной генетики
- •Лекция 2 Геномика вирусов и фагов. Вирусы как объект молекулярной генетики.
- •4. Взаимодействие вируса и клетки
- •5. Размножение вирусов и фагов. Лизогенный и литический путь
- •6. Устойчивость вирусов к факторам окружающей среды
- •Репликация генома и экспрессия генов вирусов
- •Вирусы I группы Балтимора (двухцепочечная днк)
- •Вирусы II группы Балтимора (одноцепочечная днк)
- •Вирусы III группы Балтимора (Двуцепочечная рнк)
- •Вирусы V группы Балтимора (одноцепочечная (-) рнк)
- •Вирусы VII группы Балтимора (двухцепочечная днк)
- •Характеристика вирусных геномов
- •1. Фаг (колифаг) λ лямбда
- •2. Фаг φХ174 (фи-десять 174)
- •4. Вирус sv-40
- •5. Аденовирусы
- •6. Герпесвирусы
- •7. Поксвирусы
- •8. Ретровирусы
- •9. Вирусоподобные инфекционные агенты
- •Сателлиты (вирусы-сателлиты)
- •Вироиды
- •Заключение
- •Лекция 3 Геномика прокариот
- •Прокариоты как объект молекулярно-генетических исследований
- •Структурная геномика прокариот
- •1. Размеры, нуклеотидный состав геномов и оперонная организация генов прокариот
- •2. Структуры репликации, выявление orf, интроны и интеины
- •3. Паралогичные и ортологичные гены. Сравнение геномов. Минимальный размер генома прокариот
- •Геномы прокариот в процессе функционирования и эволюции
- •1. Амплификация участков генома
- •2. Перестройки генома
- •3. Консервативная и оперативная части генома
- •4. Горизонтальный перенос генов (гпг)
- •5. Попытки установления филогенетического древа
- •Характеристика геномов прокариот
- •1. Haemophilus influenzae (возбудитель менингита, пневмонии)
- •2. Кишечная палочка Escherichia coli
- •3. Сенная палочка Bacillus subtilis
- •4. Актиномицеты рода Streptomyces
- •Заключение
- •Лекция 4 Геномика эукариот
- •Геном пекарских дрожжей Saccharomyces cerevisiae
- •Геном нематоды Caenorhabditis elegans
- •Геном плодовой мухи Drosophila melanogaster
- •Особенности исследований геномов высших растений
- •Геном резуховидки (арабидопсиса) Arabidopsis thalianа
- •Геном риса посевного Oryza sativa l.
- •Геном домовой мыши Mus musculus l.
- •Лекция 5 Геном человека
- •Программа «Геном человека»: цели и методы
- •Создание генетической карты генома
- •Создание физической карты генома
- •Секвенирование полного генома человека
- •«Черновой» (первый) вариант генома человека
- •Лекция 6 Разделы геномики
- •1. Структурная (описательная) геномика
- •Функциональная геномика и биоинформатика
- •Сравнительная (эволюционная) геномика
- •4. Экологическая геномика
- •5. Метагеномика
Функциональная геномика и биоинформатика
По состоянию на декабрь 2007 г. определены уточненные размеры разных геномов: геном человека содержит 31 897 генов, у дрожжей 7547 генов, у резушки Таля (Arabidopsis thaliana) имеется 29 388 ORF, у круглого червя (Caenorhabditis elegans) 23 399 генов, а геном мыши содержит генов на 6 тыс. больше по сравнению с геномом человека (Goodaсrе, 2007; http://eugenes.org/). Знание размера усредненного варианта человеческого генома, по образному выражению Л. Л. Киселева (Киселев, 2004), можно сравнить лишь с самым общим описанием конструкции автомобиля, включающей мотор, ходовую часть, колеса, руль, сиденья, обивку, бензин с маслом. Это описание не дает понимания взаимодействия частей и возможности управления автомобилем. Так же и геномика в настоящее время меняет свою ориентацию и осуществляет переход от структурной геномики к функциональной, основной задачей которой является «прочитать геном», установить как управляются и работают гены. Для этого потребуются еще десятилетия. Наступившая эпоха постгеномики стала эрой функциональной геномики и биоинформатики, а ее ключевыми словами — «белок» и «протеом» (вместо «ДНК» и «геном»).
Функциональная геномика использует математические методы для предсказания локализации гена или регуляторного участка в нуклеотидной последовательности. Биоинформатика дает об этом исходную информацию с вероятностью правильного предсказания около 85 %. Наличие предсказанного гена затем проверяется экспериментально: предполагаемый участок гена «вырезается» из ДНК и проверяется, кодирует ли он синтез белковой молекулы. В современных базах данных сосредоточена информация о нескольких миллиардах пар нуклеотидов (геномов) и аминокислотной последовательности белков у человека и других живых организмов. Компьютерная программа профессора Н. А. Колчанова (Институт цитологии и генетики СО РАН) позволяет разобраться в это океане информации и находить начала генов, их окончания и регуляторные участки. Другие программы — М. А. Ройтберга (Roytberg, 1992), а также М. С. Гельфанда и А. А. Миронова (Гельфанд, 1998) — осуществляют поиск собственно генов, то есть расшифровывают нуклеотидные последовательности.
Изменчивость набора белков организма — его протеома зависит от двух процессов: во-первых, на каждой стадии онтогенеза функционируют разные части генома; во-вторых, большая часть транскриптов РНК у человека и высших организмов претерпевают альтернативный сплайсинг. При этом несколько экзонов, содержащихся в пре-мРНК, могут объединяться в разных комбинациях с образованием различных мРНК. Это создает возможность синтеза разных белков на базе одной кодирующей последовательности (гена).
Если в гене имеется N интронов, то в ходе сплайсинга происходит N стадий вырезания интронов и сшивания экзонов. При этом экзоны одного гена могут стыковаться в разной последовательности, а некоторые экзоны могут удаляться вместе с соседними интронами. В результате этих событий один и тот же ген может кодировать целое семейство генов, сходных, но функционально разных. Имеются данные, что один ген может кодировать до 40 тыс. генов (Modrek, Lee, 2002). Это удивительное явление иллюстрируют два примера.
Ген дрозофилы содержит 95 альтернативных экзона. Он кодирует один из белков рецептора аксона. За счет альтернативного сплайсинга этого гена может образовываться 38 016 различных мРНК.
Ген slo у человека регулирует работу внутреннего уха. Белок этого гена присутствует в ворсинках, которые отвечают за распознавание высоты звука. Он содержит 35 экзонов, 8 из которых могут присутствовать или отсутствовать в зрелой мРНК. Возможное число вариантов сплайсинга равно 8! =40 320 (8! читается математически 8-факториал). Из этих вариантов экспериментально идентифицировано 500. Существование других пока не установлено: ведь природа может не реализовывать все возможные варианты. При данном множественном сплайсинге разные типы волосяных клеток внутреннего уха реагируют на звуки разных частот от 20 до 20 тыс. герц. Различия клеток в восприятии частоты определяется свойствами альтернативных сплайс-форм гена slo.
Экспериментально показано, что у человека 74 % генов работают с использованием альтернативного сплайсинга, а возможность продуцирования различных белков оценивается равной 106= 1 миллион (Oh et al., 2004). Выделить и охарактеризовать все эти белки невозможно. Нуклеотидная последовательность гена человека и эукариот не дает точной информации о том, какой белок он кодирует. Современное определение понятия «ген эукариот» можно представить в следующей формулировке (Киселев, 2004):
это длинная, случайная, не кодирующая последовательность нуклеотидов, в которой расположены экзоны. способные после вырезания из транскрипта этого гена и их объединения в строго определенной очередности кодировать определенную функцию.