Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Расшифровка генома человека

.docx
Скачиваний:
94
Добавлен:
16.05.2015
Размер:
82.23 Кб
Скачать

Почти все цели, которые ставил перед собой проект, были достигнуты быстрее, чем предполагалось. Проект по расшифровке генома человека был закончен на два года раньше, чем планировалось. Проект поставил разумную, достижимую цель секвенирования 95 % ДНК. Исследователи не только достигли её, но и превзошли собственные предсказания, и смогли секвенировать 99,99 % человеческой ДНК. Проект не только превзошёл все цели и выработанные ранее стандарты, но и продолжает улучшать уже достигнутые результаты.

[править]Как были достигнуты результаты

Первое бумажное издание человеческого генома, выставляется в лондонском музееWellcome Collection (англ.)

Проект финансировался правительством США через Национальный Институт Здравоохранения и британским благотворительным обществом Wellcome Trust (англ.), которое финансировало Институт Сенгера, а также множество других групп по всему свету. Финансирование распределялось между несколькими крупными центрами секвенирования включая Whitehead Institute (англ.), Институт СенгераУниверситет Вашингтона в Сент-Луисе и Baylor College of Medicine (англ.).

Геном был разбит на небольшие участки, примерно по 150 000 пар нуклеотидов в длину. Эти куски затем встраивали в вектор, известный как Искусственная бактериальная хромосома (англ.) или BAC. Эти векторы созданы из бактериальных хромосом, измененных методамигенной инженерии. Векторы, содержащие гены, затем можно вставлять в бактерии, где они копируются бактериальными механизмамирепликации. Каждый из кусочков генома потом секвенировали раздельно методом дробовика, и затем все полученные последовательности собирали воедино уже в виде компьютерного текста. Размеры полученных больших кусков ДНК, собираемых для воссоздания структуры целой хромосомы, составляли около 150 000 пар нуклеотидов. Такая система известна под именем «иерархического метода дробовика», потому что вначале геном разбивается на куски разного размера, положение которых в хромосоме должно быть заранее известно.

[править]Сопоставление данных общего и частного проектов

Крейг Вентер

В 1998 году, американский исследователь Крейг Вентер и его фирма «Celera Genomics» запустили аналогичное исследование, финансированное частным капиталом. В начале 1990-х, когда проект «Геном человека» только начинал работу, Вентер тоже работал в Национальном институте здоровья США. Целью его собственного $300-миллионного проекта «Celera» было более быстрое и дешёвое секвенирование человеческого генома, чем в $3-миллиардном государственном проекте.

«Celera» использовала более рискованную разновидность метода фрагментации генома, которую использовали ранее для секвенирования бактериальных геномов размером до шести миллионов пар нуклеотидов в длину, но никогда для чего-либо столь большого, как человеческий геном, состоящий из трёх миллиардов пар нуклеотидов.

Вначале «Celera» анонсировала, что она будет добиваться патентной защиты «всего лишь 200 или 300» генов, но позднее внесла поправки, что ищет «защиту интеллектуальной собственности» на «полное описание важнейших структур», составляющих примерно 100—300 целей. Наконец фирма подала[10] предварительные патентные заявки на 6500 целых или частичных генов. «Celera» также обещала опубликовать результаты своей работы согласно условиям «Бермудского заявления (англ.)» 1996 года, выпуская новые данные ежеквартально (проект «Геном человека» выпускал новые данные ежедневно), однако, в отличие от проекта с государственным финансированием, фирма не даёт разрешения на свободное распространение или коммерческое использование своих данных.

В марте 2000 года, президент США Билл Клинтон заявил, что последовательность генома не может быть запатентована и должна быть свободно доступна для всех исследователей. После заявления президента акции компании «Celera» сильно упали, что потянуло вниз весьбиотехнологический сектор Nasdaq, потерявший около 50 миллиардов долларов рыночной капитализации за два дня.

Хотя рабочий вариант генома был анонсирован в июне 2000 года, «Celera» и учёные, работавшие в проекте «Геном человека», опубликовали детали своей работы только в феврале 2001 года. Специальные выпуски журнала «Nature» (который публиковал научные статьи государственного проекта[11]) и журнала «Science» (который опубликовал статью «Celera»[12]) описали методы, использовавшиеся для производства черновика последовательности, и предложили её анализ. Эти черновики покрывали примерно 83 % генома (90 % эухроматиновых регионов с 150 000 брешей, а также содержали порядок и ориентацию многих всё ещё не законченных сегментов). В феврале 2001 года, во время подготовки совместных публикаций, были выпущены пресс-релизы, говорящие о том, что проект был завершён обеими группами. В 2003 и 2005 гг. были анонсированы улучшенные черновики, содержавшие приблизительно 92 % последовательности.

Соревнование очень хорошо сказалось на проекте, заставив участников государственного проекта модифицировать свою стратегию, чтобы ускорить ход работы. Вначале конкуренты согласились объединить результаты, но союз распался после того, как «Celera» отказалась сделать свои результаты доступными через публичную базу данных GenBank с неограниченным доступом для всех пользователей. Celera включила данные проекта «Геном человека» в собственную последовательность, однако запретила попытки использовать свои данные для всех сторонних пользователей.

«Геном человека» — это наиболее известный из многих международных геномных проектов, нацеленных на секвенирование ДНК конкретного организма. В настоящее время знание последовательности человеческой ДНК приносит наиболее ощутимую пользу. Кроме того, важные достижения в биологии и медицине ожидаются в результате секвенированиямодельных организмов, в число которых входят мыши, дрозофилыDanio rerioдрожжинематоды, некоторые растения и множество микробов и паразитов.

В 2004 году исследователи из Международного Консорциума по Секвенированию Человеческого Генома (англ. International Human Genome Sequencing Consortium) (IHGSC) проекта «Геном человека» огласили новую оценку числа генов в человеческом геноме составившую от 20 до 25 тыс.[13] Ранее предсказывалось от 3 до 40 тыс., а в начале проекта оценки доходили до 2 млн. Это число продолжает колебаться, и в настоящее время ожидается, что ещё в течение многих лет не удастся прийти к согласию по поводу точного количества генов в человеческом геноме.

[править]История частного проекта

Детали по данной теме смотри в статье История генетики.

В 1976 году Уолтером Фирсом[ru]и его командой в Университете Гента (ГентБельгия) был определён первый полный геном вируса — бактериофага MS2[ru][14]. Идея техники фрагментирования ДНК (англ. shotgun) пришла от использования алгоритма, который комбинировал информацию о последовательности от многих небольших фрагментов ДНК для реконструирования генома. Эту технику ввёл Сенгер, чтобы секвенировать геном фага Фи-X174 (англ.), вируса, который инфицирует бактерии (бактериофаг); это был первый ещё в 1977 году полностью секвенированный геном (последовательность ДНК)[15]. Техника была называна «shotgun sequencing» (метод дробовика), потому что геном дробится на множество кусочков, как будто в него выстрелили из дробовика. Чтобы масштабировать метод, и секвенирование, и сборку генома нужно было автоматизировать, что и произошло в 1980-х.

В 1995 году было показано, что данная техника применима к секвенированию первого бактериального генома (1,8 миллиона пар нуклеотидов) свободно живущего организмаHaemophilus influenzae[16] и первого генома животного (~100 млн пар оснований)[17]. Метод включает использование автоматизированных секвенаторов, что позволяет определять более длинные индивидуальные последовательности (в то время однократно получалось приблизительно 500 пар нуклеотидов). Пересекающиеся последовательности размером примерно в 2000 пар нуклеотидов «читали» в двух направлениях, это были критические элементы, создание которых повлекло за собой разработку первых компьютерных программ сборки генома, необходимых для реконструирования больших регионов ДНК, известных под названием контиги ('contigs').

Три года спустя, в 1998 году, заявление только что созданной компании «Celera Genomics» о том, что она собирается масштабировать метод фрагментирования ДНК на человеческий геном, в некоторых кругах было встречено скептически. Техника фрагментирования разрывает ДНК на фрагменты различных размеров, от 2 до 300 тыс. пар нуклеотидов в длину, образуя то, что называется «библиотекой ДНК». Затем ДНК «читают» с помощью автоматического секвенатора кусками по 800 пар нуклеотидов длиной с обоих концов каждого фрагмента. С помощью сложного алгоритма сборки и суперкомпьютера, кусочки собирают воедино, после чего геном может быть реконструирован из миллионов коротких фрагментов длиной в 800 пар нуклеотидов. Успех как государственного, так и частного проектов зависел от новой, более высоко автоматизированной капиллярной секвенирующей ДНК машины, которая называлась Applied Biosystems 3700. Она прогоняла цепочки ДНК через необычайно тонкую капиллярную трубку, а не через плоский гель, как это делали в ранних моделях секвенаторов. Ещё более критическим фактором была разработка новой, более масштабной программы сборки генома, ассемблера, который мог бы обрабатывать 30-50 миллионов последовательностей, требующихся для секвенирования всего человеческого генома. В то время такой программы не существовало. Одним из первых крупных проектов в «Celera Genomics» стала разработка данного ассемблера, который был написан параллельно с созданием большой, высокоавтоматизированной фабрики секвенирования геномов. Разработка ассемблера велась под руководством Брайена Рамоса (англ. Brian Ramos). Первая версия появилась в 2000 году, когда команда «Celera» объединила силы с профессоромДжеральдом Рубином (англ.) для секвенирования генома фруктовой мушки Drosophila melanogaster методом фрагментирования генома[18]. Собрав 130 миллионов пар нуклеотидов, программа обработала, по меньшей мере, в 10 раз больше данных, чем любой ранее собранный из результатов метода фрагментирования геном. Год спустя команда «Celera» опубликовала свою сборку трёх миллиардов пар нуклеотидов человеческого генома.

[править]Как были достигнуты результаты

IHGSC для ориентации и проверки правильности сборки последовательности каждой человеческой хромосомы использовал секвенирование концевых фрагментов в сочетании с картированием больших (около 100 тыс. пар оснований) плазмидных клонов, полученных методом фрагментирования генома, а также применял метод фрагментирования меньших субклонов тех же плазмид, а также множество других данных[11].

Группа «Celera» понимала важность метода фрагментирования генома и тоже использовала саму последовательность, чтобы ориентировать и найти правильное местоположение секвенированных фрагментов внутри хромосомы. Однако компания использовала и публично доступные данные из проекта «Геном человека», чтобы контролировать процесс сборки и ориентации, что поставило под вопрос независимость её данных[12][19][20].

[править]Доноры генома

В межгосударственном проекте «Геном человека» (HGP), исследователи из IHGSC взяли у большого числа доноров образцы крови (женщин) и спермы (мужчин). Из числа собранных образцов источником ДНК стали лишь несколько. Таким образом, личности доноров были скрыты, чтобы ни доноры, ни учёные не могли знать, чья именно ДНК была секвенирована. Во всём проекте были использованы многочисленные клоны ДНК из различных библиотек (англ.). Большинство из этих библиотек были созданы доктором Питером де Хонгом (англ. Pieter J. de Jong). Неформально сообщалось, и в сообществе генетиков хорошо известно, что большая часть ДНК в государственном проекте получена от единственного анонимного донора — мужчины из Буффало (кодовое название RP11)[21].

Учёные HGP использовали белые кровяные клетки из крови двух мужчин и двух женщин доноров (случайно выбранных из 20 образцов каждого пола) — каждый донор стал источником отдельной библиотеки ДНК. Одна из этих библиотек (RP11) использовалась значительно больше, чем другие по соображениям качества. Небольшой технический нюанс заключается в том, что мужские образцы содержали только половину количества ДНК, поступившего из X и Y хромосом в сравнении с другими 22 хромосомами (аутосомами); это происходит потому, что каждая мужская клетка (сперматозоид) содержит только одну X- и одну Y-хромосому, а не две, как другие хромосомы (аутосомы).

Хотя главная секвенирующая фаза проекта «Геном человека» завершена, исследования изменчивости ДНК продолжаются в международном проекте HapMap, цель которого состоит в идентификации структуры групп однонуклеотидного полиморфизма (SNP) (которые называются гаплотипами). Образцы ДНК для HapMap получены от, в общей сложности, 270 человек: народа Йоруба в Ибадане (Нигерия), японцев из Токиокитайцев из Пекина и французского источника Centre d'Etude du Polymorphisms Humain (англ.) (CEPH), который состоит из резидентов США, имеющих происхождение из западной и Северной Европы.

В проекте компании «Celera Genomics» для секвенирования использовалась ДНК, поступившая от пяти различных человек. Крейг Вентер, в то время бывший главным научным руководителем «Celera Genomics», позднее признался (в публичном письме в журнал «Science»), что его ДНК была одним из 21 образцов в общем фонде, пять из которых были отобраны для использования в проекте[22][23].

4 сентября 2007 года, команда под руководством Крейга Вентера опубликовала полную последовательность его собственной ДНК[24], впервые сняв покров тайны с шестимиллиарднонуклеотидной последовательности генома единственного человека.

[править]Перспективы

Работа над интерпретацией данных генома находится всё ещё в своей начальной стадии. Ожидается, что детальное знание человеческого генома откроет новые пути к успехам вмедицине и биотехнологии. Ясные практические результаты проекта появились ещё до завершения работы. Несколько компаний, например «Myriad Genetics (англ.)», начали предлагать простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак грудинарушения свёртываемости кровикистозный фиброз, заболевания печени и многим другим. Также ожидается, что информация о геноме человека поможет поиску причин возникновения рака,болезни Альцгеймера и другим областям клинического значения и, вероятно, в будущем может привести к значительным успехам в их лечении.

Также ожидается множество полезных для биологов результатов. Например, исследователь, изучающий определённую форму рака может сузить свой поиск до одного гена. Посетив базу данных человеческого генома в сети, этот исследователь может проверить что другие учёные написали об этом гене включая (потенциально) трёхмерную структуру его производного белка, его функции, его эволюционную связь с другими человеческими генами или с генами в мышах или дрожжах или дрозофиле, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела в которых ген активируется, заболеваниями, связанными с этим геном или другие данные.

Более того, глубокое понимание процесса заболевания на уровне молекулярной биологии может предложить новые терапевтические процедуры. Учитывая установленную огромную роль ДНК в молекулярной биологии и её центральную роль в определении фундаментальных принципов работы клеточных процессов, вероятно, что расширение знаний в данной области будет способствовать успехам медицины в различных областях клинического значения, которые без них были бы невозможны.

Анализ сходства в последовательностях ДНК различных организмов также открывает новые пути в исследовании теории эволюции. Во многих случаях вопросы эволюции теперь можно ставить в терминах молекулярной биологии. И в самом деле, многие важнейшие вехи в истории эволюции (появление рибосомы и органелл, развитие эмбрионаиммунной системы позвоночных) можно проследить на молекулярном уровне. Ожидается что этот проект прольёт свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами (приматами, а на деле и всеми млекопитающими).

Проект определения разнообразия человеческого генома (англ.) (HGDP), отдельное исследование, нацеленно на картирование участков ДНК, которые различаются между этническими группами.[25] В будущем HGDP, вероятно, сможет получить новые данные в области контроля заболеваний, развития человека и антропологии. HGDP может открыть секреты уязвимости этнических групп к отдельным заболеваниям и подсказать новые стратегии для их преодоления (см. Раса и здоровье (англ.)). Он может также показать, как человеческиепопуляции адаптировались к этим заболеваниям.