Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
gene_expression.doc
Скачиваний:
631
Добавлен:
13.03.2016
Размер:
6.12 Mб
Скачать
    1. Определение полной первичной структуры днк генома человека

Исчерпывающая физическая карта генома человека (и любого другого организма) должна представлять собой полную последовательность нуклеотидов ДНК всех его хромосом. Благодаря тому, что к решению такой грандиозной по объему задачи привлечены многие хорошо финансируемые лаборатории в разных странах мира и для этих целей используются автоматические высокопроизводительные секвенаторы, она представляется скорее рутинной, чем захватывающей. Секвенирование начинается с субклонирования небольших рестрикционных фрагментов ДНК, образуемых в результате рестрикции предварительно клонированных более крупных фрагментов, и первичная структура коротких фрагментов далее определяется одним из известных методов.

Опубликованные одновременно в 1977 г. методы секвенирования ДНК А. Максама и У. Гилберта, а также Ф. Сенгера сделали процесс определения первичной структуры генов доступным любой биохимической лаборатории. С тех пор метод Сенгера, основанный на случайной терминации синтеза ДНК in vitro как следствие включающихся в синтезируемую цепь ДНК дидезоксирибонуклеозидмонофосфатов, получил широкое распространение. Дальнейшим развитием метода Сенгера было использование в продукте реакции флуоресцентной метки вместо радиоактивной, что позволило автоматизировать процесс секвенирования. Во многих случаях для определения первичной структуры того или иного участка ДНК теперь уже нет необходимости в предварительном клонировании соответствующего фрагмента, поскольку разработаны эффективные методы секвенирования непосредственно продуктов ПЦР. Все это резко стимулировало эффективность анализа первичной структуры генов. Однако необходимо иметь в виду, что длина ДНК даже самой маленькой Y-хромосомы человека составляет 50 м.п.о., а лучшие автоматические секвенаторы сегодняшнего дня позволяют определять за один год последовательность из 0,1 м.п.о. Это наглядно демонстрирует масштабы задачи, которую предстоит решить3.

    1. Базы данных получаемой информации

Полное использование информации о структуре генома человека в биологии и медицине станет возможным лишь в отдаленном будущем. Еще долгие годы предстоит собирать и обрабатывать получаемую информацию, устранять противоречия между экспериментальными данными разных лабораторий. Одна только запись всей последовательности нуклеотидов генома человека обычным шрифтом потребует ~200 томов книг по 1000 страниц каждая. Анализ такого объема информации неминуемо повлечет за собой необходимость разработки новых подходов в информатике и будет невозможен без создания уникальных алгоритмов обработки информации с помощью вычислительной техники.

По мере накопления информации о последовательностях нуклеотидов различных частей генома человека на первое место будут выходить задачи по идентификации среди них функционально значимых. В первой части книги уже подчеркивалось, что даже определение границ генов в ряде случаев является трудно разрешимой задачей. То же относится и к идентификации регуляторных последовательностей генов. Не исключено, что накопление новых данных о структуре генома человека, в конце концов, потребует пересмотра как критериев функциональной значимости нуклеотидных последовательностей генома, так и самой концепции гена.

Крупнейшей базой данных по структуре генома человека в настоящее время является GDB (Genome Data Base), созданная и поддерживаемая в университете Дж. Гопкинса (Балтимор, США). Кроме известных последовательностей нуклеотидов генома человека в ней хранится вся получаемая информация о генетических маркерах, зондах и контигах, ассоциированных с генетическими заболеваниями. Проводятся работы по включению в базу данных результатов физического картирования генома. В этом же университете поддерживается база данных по менделевскому наследованию у человека (Online Mendelian Inheritance in Man Database), которая представляет собой каталог наследуемых признаков и наследственных заболеваний человека.

Четыре другие базы данных хранят все известные последовательности нуклеотидов, включая последовательности нуклеотидов генома человека: GenBank и Genome Sequence Data Base (GSDB) в США, European Molecular Biology Laboratory (EMBL) Nucleotide Sequence Database в Великобритании, а также DNA Data Bank of Japan (DDBJ). В этих базах данных в 1996 году хранилось 200 м.п.о. последовательностей нуклеотидов, предоставленных как самими авторами, так и вводимых из статей, опубликованных в периодических изданиях. В России Институтом молекулярной биологии РАН поддерживается аналогичная база данных по геному человека (Hugene) с более скромными задачами, работающая на отечественном программном обеспечении. Основной международной базой данных по последовательностям аминокислот является Protein Identification Resource (Швейцария).

Принесет ли молекулярной генетике определение полной первичной структуры генома человека принципиально новые знания? Действительно, максимальную информацию о функционировании генома и функциональной значимости его основных частей могло бы принести только полное сравнительное секвенирование двух геномов, принадлежащих разным индивидуумам. Это позволило бы отделить консервативные последовательности от последовательностей, изменяющихся в процессе онтогенеза. Ведь даже в двух соседних соматических клетках одного организма последовательности нуклеотидов различаются из-за соматического мутагенеза. Выполняемая же программа исследований по геному человека в конечном счете даст только усредненную информацию. Если же, как это предполагается в разделе 5.3, основной функцией избыточных последовательностей, составляющих 90% генома млекопитающих, является обеспечение запрограммированной скорости изменения отдельных генетических локусов под действием мутаций, и(или) поддержания пространственной структуры кодирующих частей генов, то полное секвенирование таких последовательностей будет лишено большого смысла. Каков будет конец этой истории, может показать только будущее.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]