Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Введение в мед генетику.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
77.31 Кб
Скачать

Окончательная анатомия: секвенирование генома человека

Как было замечено ранее, большинство генов, которые были картированы до проекта HGP, были картированы формально. К тому же технические возможности клонирования для изоляции пораженного гена были постигнуты и получили принципиальную основу только в 1986.

ДНК была открыта в ХIX веке. То, что ДНК является хранилищем генетической информации, было впервые установленно Avery, McLeod, и McCarty в 1944 г . на примере пневмококка (30). Они нашли, что так называемый трансформирующий фактор, который превращает один вид пневмококка в другой и есть ДНК. В 1953 г. Уотсон и Крик (7) выявили двухцепочную структуру ДНК при помощи рентгеновской диффракции. Генетический код триплета нуклеотида, специфичный для каждой нуклеиновой кислоты был детально выяснен в 1966 г. В конце 60-х были открыты ограничительные ферменты, которые рассекали ДНК в определенных местах, и таким образом, могли послужить скальпелем для рассечения генома. В начале 70-х было обнаружено, что гены (включая также человека) могут быть клонированы в избытке и соединены с ДНК в бактерии плазмодия (31) и может быть выращена бактерия при помощи так называемой рекомбинативной ДНК технологии.

В 1977 г. об улучшении методики секвенирования ДНК было доложено Maxam and Gilbert (32) и Sanger et al. (33). Замечательно, что метод Sanger стал краеугольным камнем проекта Генома Человека (HGP); метод был модифицирован, автоматизирован и стал более эффективным, но остался принципиально основным в этих исследованиях.

Кольцевые хромосомы плазматических органел молочнокислых бактерий, в частности митохондрии, были полностью расшифрованы ( все 16 569 нуклеотидов ) группой Sanger в 1981 году. Таким образом некоторые исследователи были воодушевлены возможностью раскрыть полный клеточный геном. Как ранее и предполагалось, полная расшифровка последовательности нуклеотидов (секвенирование генома человека) пришла из лабораторий департамента Энергетики США, который был ответственен за работы по мутагенному эффекту радиации. Важно рассмотреть проблему рака, которая была затронута Renato Dulbecco (35) как главная мотивация для работ по HGP. Возможно, геномика нанесет решающий удар по раку. Событие полезное для понимания картирования всех генов в плане изучения врожденных дефектов произошло ранее (36). В 20-х годах Haldane указал на важность генетического сцепления в диагностике и в своей “Croonian Lecture” в 1948 г написал, что “…конечной целью должно быть перечисление и размещение всех генов найденных в нормальном человеческом бытие.”

Проект «Геном Человека» (HGP) обсуждали и планировали, спорили о нем между 1985 и 1990 годами. Официальным стартом программы в США является 1 октября 1990 (38). Национальный исследовательский совет \Национальная Академия Наук (NRC/NAS) как комитет (39) по картированию и структуре ДНК в человеческом геноме предположил, что полная карта генов и последовательность нуклеотидов может быть расшифрована в течении 10-15 лет и будет стоить около 200 миллионов долларов в год. В ретроспективе, это можно рассматривать как замечательное и проницательное заключение. Полимеразная цепная реакция была анонсирована на встрече в Cold Spring Harbor, NY в 1986 (40), где статус генетической карты Homo Sapiens был рассмотрен (41) и проект HGP активно обсуждался в финале конференции. Искусственные хромосомы дрожжей были открыты в 1987 г. искусственные бактериальные хромосомы и искусственные хромосомы плазмодия были позже использованы как другие механизмы для клонирования больших участков ДНК. Много полиморфных и других полезных связывающих маркеров, микросателлитов было открыто в 1989 и начале 90-х. В конце концов, однако, запас средств оказался не так велик.

NRC/NAS комитет рекомендовал - “ карта вначале, секвенирование позже” (39) –потому, что технология определения последовательности азотистых оснований была еще на не достаточно эффективном экономическом уровне и потому, что 2 карты: генетическая (микросателлитные маркеры и т.д (42)); и физическая (искусственные хромосомы клонов дрожжей (43) могли быть полезными для окончательной расшифровки последовательности нуклеотидов. Таким образом проект HGP Национального Института Здоровья был более или менее успешным к 1 октября 1990 когда эта программа было начата под руководством первого директора James D.Watson. Его последователем в 1993 году стал Francis S. Collins.

Другие рекомендации NRC/NAS комитета заключались в том, чтобы другие модельные организмы исследовалась параллельно с человеком (39). Сравнительная геномика является важной областью для понимания структуры и функций человеческого генома и его генов.

Метод Expressed Sequence Tags (EST) – комплементарные ДНК последовательности полученные путем обратной транскрипции от информационной РНК, был разработан в 1991 году (44). Его можно считать своеобразным «коротким или кодирующим геномом человека». Большое количество EST данных, как для человека так и для многих других видов, является ценным материалом для сравнительной геномики.

Первым свободно живущим организмом, геном которого был полностью расшифрован, была бактерия Haemophilus influenzae, с 1 830 137 нуклеотидами и около 1 800 кодирующих белки генов. Эта структура была расшифрована группой J. Craig Venter (45) c применением обратного подхода. Кольцевая ДНК бактериальных хромосом была разбита на сегменты, затем эти сегменты были клонированы и соединены наугад, а в индивидуальные последовательности были собраны через узнавание перекрывающихся концов. С того времени геномы значительного количества микроорганизмов были расшифрованы тем же самым способом, среди них Helicobakter pylori, Mycobacterium tuberculosis, и Treponema pallidum. В 1996, была полностью расшифрована структура первого ядерного ( эукариотического) организма - пекарских дрожжей (Saccharomyces cereviseae) (46). Нематода Caenorhabditis elegans , была первым многоклеточным организмом полностью расшифрованным в 1998 (47,48). А о секвенировании генетического животного Drosophila melanogaster было доложено в марте 2000 года (49). Первые 2 эукариота были секвенированы по методу “clone by clone”, а третий (дрозофила) в комбинации этого метода с методом случайности (“shotgun”).

Используя успех со случайной последовательностью нуклеотидов клона с последующим собранием в микроорганизме, Venter с коллегами применили тот же метод на человеке. Они основали частную компанию (Cerela Genomic Inc.) работающую по принципу фабрики: ДНК и получение клонов, секвенирование и объединение с автоматизацией и компютеризацией всех этапов. Подход контролировался подобным анализом секвенирования генома Дрозофилы. Геномы пяти добровольцев, представляющих 4 расовые группы и оба пола, были расшифрованы Cerela (50). Общий объем HGP поднялся на новый уровень ускорения и соперничества в координации работ с различными лабораториями США, Объединенного Королевства, Японии, Франции и Германии и других стран под руководством Francis Collins (51).

К данным полученным из общественного запаса HGP был обеспечен свободный доступ. Данные о секвенировании полученные Cerela были детально сравнены с общественной базой данных и содержанием компьютерных методов анализа, академическими методами исследования подписанными и фармацевтическими и другими неакадемическими лабораториями.

В Белом Доме 26 июня 2000 года Collins и Venter представили комплект первоначальных общественных и частных результатов секвенирования человека, которые были опубликованы в середине февраля 2001 года. Результаты общественного фонда опубликованы в журнале Nature (51), а результаты Cerela в журнале Science (50). Каждый журнал сопровождался статьей, содержащей новую информацию.

Когда полный результат секвенирования человеческого генома был полностью известен, то количество найденных генов составило только половину от ранее предсказанного (52) и немного больше чем двойное количество в очень простом организме, таком как нематода C. elegans. Например, возрастание сложности человека по сравнению с нематодой, достигается возрастанием количества различных белков кодируемых в единичных генах, через альтернативный сплайсинг мессенджеров РНК, посттранскрипционных и посттрансляционных модификаций, формированием гетеромерных белков (т.е. белков как продуктов комбинации транскриптов 2-х и более генов) и т.д. Оценка свидетельствует, что 30 000-40 000 генов кодирует в 10 раз большее количество белков. Результатом этого стало частичное смещение фокуса научных исследований с гена к белку и с геномного уровня на белковый уровень, т.е. от геномики к протеомике (53-55).

Другой интересной, но не новой информацией в секвенированном геноме человека (50,51) была неоднородная плотность генов в пределах хромосомы (гены обнаруживают тенденцию концентрироваться на концах хромосом) и между отдельными хромосомами. Хромосомы 19 и 22 особо богаты генами, а хромосомы 13, 18, и 21 относительно бедны. До завершения проекта HGP, информация об изменении генетической плотности была уже известна на основе количественного картирования генов и косвенно на основании определения количества определенных пар нуклеотидов GC vs AT по длине хромосом. Тем не менее более точная верификация в проекте HGP чрезвычайно важна.