Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

РАЗОБРАННЫЕ БИЛЕТЫ

.pdf
Скачиваний:
221
Добавлен:
09.05.2021
Размер:
1.43 Mб
Скачать

5.Позволяет решать аналитические задачи (разделение, идентификация, определение) и препаративные (очистка, выделение, концентрирование). Все это можно делать в режиме реального времени.

Процесс: Сначала идет культивирование целевого белка в клетках. После этого клетки разрушаются (например, ультразвуком) и полученная масса центрифугируется. Полученный супернатант подвергают очистке. Тип хроматографии выбирается на основе белка.

Принцип аффинной: в основе лежит реакция взаимодействия разделяемых примесей с лигандом, связанным с инертным носителем. В роли примесей выступают биологически активные вещества (белки, ферменты), вступающие с лигандом в биохимическое взаимодействие.

Примеры биоспецифических взаимодействий:

5)антиген, вирус, клетка – антитело,

6)Гормон, витамин – рецептор

7)фермент – субстрат, ингибитор, кофактор

8)ионы металлов – полигистидиновые последовательности, комплементарные последовательности нуклеиновых кислот. (не для белков)

Именно высокая специфичность подобного взаимодействия обусловливает высокую эффективность аффинной хроматографии и её широкое (по сравнению с другими видами лигандной хроматографии) распространение. Суть в том, что она использует структурные особенности белков для разделения. Преимущества – высокая степень очистки, недостатки – загрязнение лигандом.

Это уникальная технология, так как только она помогает очистить биомолекулы на основе их биологической функции или химической структуры.

Конкретные примеры:

3)Иммобилизованный белок A (белок, выделенный с поверхности клеточной стенки золотистого стафилококка) широко используется для очистки lgG (иммуноглобулинов класса G) в препаративных и промышленных масштабах.

4)Белок G (экспрессируются в стрептококках групп C и G) связывается с альбумином. Имеет сходства с белком A, но отличается специфичностью, тем не менее, находит широкое применение для очистки иммуноглобулинов.

3) Гепарин часто используется в качестве лиганда для ДНК-связывающих белков (рестриктазы, полимеразы)

* Иммобилизация фермента – это прикрепление фермента к некоторому нерастворимому носителю, причем таким образом, чтобы фермент мог обмениваться с раствором молекулами субстрата и продукта.

Билет 14.

1.Современные технологии полногеномного секвенирования. Общая схема и примеры.

Вотличие от секвенирования по Сэнгеру, методы секвенирования новых поколений

поколение значительно производительнее, позволяют одновременно считывать миллионы коротких фрагментов. Такой рост производительности привел к возможности определения последовательности сразу десятков геномов (в зависимости от их размера) за один запуск прибора.

Секвенирование полных геномов используется для: картирования геномов новых организмов, финализации имеющихся сборок геномов известных организмов или сравнения геномов в нескольких образцах, помогает при построении референсных геномов, для идентификации организмов и других сравнительных геномных исследований.

Применение:

Секвенирование геномов и транскриптомов de novo – получение геномов организмов, для которых не доступен референс (практически ценны, эволюционно интересны). Отправная точка большинства молекулярнобиологических и генетических исследований на немодельных объектах, поиск крупных геномных перестроек.

Полногеномное ресеквенирование – секвенирование геномов, для которых уже есть референс. Поиск мутаций (сравнение геномов больного и здорового), ассоциированных с болезнями, картирование генов.

Направленное секвенирование – есть определённый круг генов-кандидатов и нужно секвенировать только их, не прибегая к последовательности всего генома (скрининг мутаций с известной ролью в развитии болезней и поиск новых мутаций – тут работа с экзонами).

Анализ транскриптома – сравнение уровней экспрессии, поиск новых генов и изоформ, аннотация de novo секвенированных геномов.

Изучение эпигенетических перестроек, например, метилирования ДНК.

ДНК-белковые и ДНК-ДНКовые взаимодействия – поиск сайтов связывания транскрипционных факторов, изучение пространственной организации хроматина

Метагеномика – анализ разнообразия микробных сообществ

Области применения секвенирования новых поколений:

1.Фундаментальные исследования

10.Контроль качества продуктов питания

2.Секвенирование геномов человека -

11.Метагеномика

прогнозирование

12.

Селекционная работа

3.Диагностика инфекционных болезней

13.ДНК-генеалогия

4.Ретроспективный эпиданализ

14.

Этногеномика

5.Медицинская генетика

15.

Палеогеномика

6.Пренатальная диагностика

 

 

7.Фармакогеномика и устранение побочных

16. Идентификация человека по ДНК:

эффектов

определение отцовства, геномная

8.Трансплантология

дактилоскопия

Биобезопасность

17.Образование

Общая схема секвенирования следующих поколений:

1)Приготовление библиотеки (дробление ДНК (на фрагменты 200-500 по) и лигирование адапетров – синтетических последовательностей ДНК, которые потом служат для прикрепеления исследуемых фрагментов на твердый носитель, для отжига сиквенсного праймера) – происходит НЕ в приборе.

2)Амплификация индивидуальных фрагментов – ПЦР – и отжиг (связывание с матрицей) праймеров – перенос в секвенатор

3)Синтез (достравивание) цепи (уже в секвенаторе), комплементарной секвенируемому фрагменту.

Параллельно с этим происходит испускание сигнала (свет, изменение pH – поразному), сигнал детектируется прибором, регистрация происходит много раз в зависимости от выбранной длины чтения.

4)По завершении чтения происходит интеграция сигнала, перевод в последовательность ДНК

454 пиросеквенирование. ДНК фрагментируют и лигируют адаптеры к краям фрагментов. Один фрагмент ДНК закрепляется на микрошарике, покрытом олигонуклеотидами, комплементарными концам адаптера. Шарики с ДНК смешивают с эмульсией, содержащей ДНК-полимеразу и нуклеотиды и проводят ПЦР. В лунки (плашки с до 1 млн лунок) загружаются шарики с ДНК, и частицы с закрепленными на них ферментами (АТФ-сульфурилазой и люциферазой). Через лунки в заданном порядке пропускают реагенты, а при присоединении нуклеотидов выделяется пирофосфат, который путем ферментативных взаимодействий превращается в АТФ – субстрат для люциферазы. Световой сигнал фиксируется детектором.

Преимущества: •большая длина чтения (сравнимо с секвенированием по Сэнгеру

•короткое время работы •наименее чувствительна к GC-составу

Недостатки: •неточность прочтения гомополимерных участков – много одинаковых нуклеотидов подряд (более 4-х) •высокая цена в расчете на нуклеотид •в 2016 году прекратилась поддержка

Illumina. ДНК фрагментируют и лигируют адаптеры к фрагментам. ДНК пропускают через каналы ячейки, покрытые праймерами, комплементарными концам адаптера. Через ячейку пропускают реагенты для достраивания второй цепи ДНК. Двуцепочечные фрагменты денатурируют. Это повторяют около 30 раз, и каждый фрагмент оказывается окружен группой идентичных молекул – кластеры. Через ячейки

пропускают полимеразу и флуоресцентно меченные нуклеотиды (за один раз на одно место может присоединиться только один нуклеотид, дальше синтез не идет – они терминированные), на ячейку светят лазером и проводят съемку (там, где светятся точки, там есть нуклеотид, который ищется), затем пропускают реагенты, отщепляющие флуорофор и терминатор. Цикл повторяют нужное число раз, число соответствует длине чтения, прибор на каждом цикле запоминает координаты кластеров, потом картинки накладываются друг на друга и устанавливают последовательность.

Преимущества: •высокая точность (частота ошибок 0,1-0,5%) •универсальность

•доступность ПО для обработки и анализа результатов •наименьшая цена получаемых данных (в расчете на нуклеотид)

Недостатки: •высокая цена реагентов •проблемы с секвенированием матриц с низкой сложностью (такая ДНК, в которой в большинстве фрагментов в большинстве позиций стоит одна и та же буква, то есть то, что секвенируется на 95% идентично) •большая длительность прогона •ошибки в GC-богатых участках (склонны образовывать шпильки, которые трудно обходить).

Повторное полногеномное секвенирование (ресеквенирование) – секвенирование полного генома орагнизма и сравнение последовательности с последовательностью известного референса. Быстрое получение точной информации о последовательности генома имеет решающее значение для обнаружения редковстречающихся мутаций, определения ключевых делеций и инсерций и обнаружения других генетических изменений.

2. Филогенетический анализ белков.

Для чего нужен. Филогенетический анализ использует аминокислотные последовательности или другие параметры, такие как последовательности доменов и трехмерную структуру, чтобы построить филогенетическое дерево – показать отношение среди различных классификационных единиц на молекулярной уровне. Филогенетический анализ может также использоваться для расследования связей в рамках отдельных таксонов, особенно для белков, которые претерпели существенные изменения в строении, но для которых исследователи имеются единой эволюционной истории.

Результаты филогенетического анализа могут быть опубликованы в виде отдельной статьи, посвящённой эволюции определённого белкового семейства, либо быть лишь составной частью более масштабного исследования. Он может проводиться на начальном этапе работы, предшествуя постановке экспериментальной задачи. Это

позволит более адекватно выбрать конкретного представителя интересующего белкового семейства для более подробного изучения:

предсказать его трёхмерную структуру и доменную организацию,

предсказать строение активного центра и наметить мишени для сайтнаправленного мутагенеза,

предсказать возможные энзиматические активности.

Он может быть проведён и на заключительном этапе исследования, позволяя определить место обнаруженного и исследованного белка в иерархической системе ранее известных белков.

Филогенетическое древо каждого домена имеет смысл сравнить с эволюционном древом организмов-хозяев, что позволит сделать вывод о характере эволюции доменов: какую роль в ней играли дупликация, потеря и слияние генов, а также их горизонтальные переносы.

Построение филогенетических деревьев – это метод проведения филогенетического анализа, заключающийся в построении схем, отражающих эволюционные взаимосвязи между различными структурами, имеющими общего «предка». Построение филогенетических деревьев возможно лишь при наличии не менее четырёх представителей анализируемого семейства белков (доменов).

Белки-гомологи — группа белков из одного и/или разных организмов, гены которых с большой степенью вероятности имеют общее эволюционное происхождение. Причины появления белков-гомологов могут быть различными: дивергенция организмов (вертикальный перенос), дупликация генов и геномов, горизонтальный перенос.

Проведение анализа:

1. Выяснение доменной структуры белка и выбор исследуемого домена.

Для работы необходимо выбрать белок с известной аминокислотной последовательностью. Как правило, молекула белка состоит из нескольких сот аминокислотных остатков.

2. Составление списка белков исследуемого семейства

На этом этапе предстоит найти максимально большое количество белков, содержащих домены, гомологичные анализируемому домену. То есть, составить полный список представителей исследуемого семейства. Возможно, что исследуемый белок принадлежит хорошо известному семейству. В этом случае есть хорошие шансы найти в интернете хорошо аннотированный список его представителей.

Если же исследуемый белок относится к малоизвестному семейству, то список его гомологов можно попытаться найти в одной из нескольких глобальных белковых классификаций, примерами которых могут служить базы данных: Pfam, InterPro, PUMA2, HOMSTRAD, SCOP, CATH, PIR.

В любом случае, удастся ли найти относительно полный список белков исследуемого семейства или не удастся и придётся начинать с единственного представителя, предстоит провести скрининг одной или нескольких баз данных с помощью программ семейства BLAST (Basic Local Alignment Search Tool) – это позволит найти в базе данных аминокислотных последовательностей достаточно полный список белков данного семейства.

3. Уточнение списка

Среди обнаруженных белков исследуемого семейства почти наверняка имеются очень схожие белки. Например, копии одного и того же белка из разных штаммов одного вида бактерий или аллельные варианты. Для филогенетического анализа семейства такие представители ценности не представляют и подобные дубли желательно удалить на данном этапе. Однако следует помнить, что в одном геноме могут быть закодированы несколько паралогов (гомологичные белки, принадлежащие одному организму, которые возникают в результате дупликации гена и могут разойтись в процессе эволюции настолько, что начнут выполнять разные функции), аминокислотные последовательности которых существенно отличаются. В качестве критерия для удаления очень близких по аминокислотной последовательности белков может служить уровень идентичности от 95% и выше.

4. Множественное выравнивание

Множественное выравнивание белков (доменов) одного семейства может быть проведено автоматически, например, с помощью программы ClustalW. Однако такое выравнивание будет близким к оптимальному лишь при высоком уровне идентичности всех анализируемых последовательностей (свыше 50%) и отсутствии в них существенного количества инсерций/делеций.

В следующих случаях:

·при уровне идентичности ниже 30%,

·при наличии протяжённых инсерций,

·при наличии факультативных N-концевых участков

получаемые машинные выравнивания не пригодны для корректного филогенетического анализа и выравнивания следует делать (или редактировать) вручную. В качестве подходящей для этого программы-редактора можно

рекомендовать BioEdit. При этом в качестве основы имеет смысл использовать полученные автоматически попарные и/или множественные выравнивания белков.

5. Интерпретация результатов, анализ

После получения множественного выравнивания имеет смысл его внимательно просмотреть. При этом особое внимание следует обратить на белки, имеющие аномальные участки в своей последовательности:

·уникальные только для данного белка делеции,

·локально низкий уровень сходства с остальными белками на высоко консервативном у них участке,

·наличие у двух очень схожих белков существенных локальных различий.

Следует выяснить причины появления таких аномальных участков. Это могут быть ошибки секвенирования (например, локальные сдвиги рамки считывания), ошибочное предсказание экзон-интронной структуры и т.д. Выявленные ошибки следует устранить или соответствующие последовательности вовсе исключить из дальнейшего анализа. Это же касается и белков, не имеющих полноразмерного анализируемого домена (фрагмент белковой последовательности).

6. Построение деревьев

Полученное множественное выравнивание может быть использовано для построения филогенетических деревьев.

Для этого рекомендуется пользоваться, например, программами PROTPARS (Protein

Sequence Parsimony method) и NEIGHBOR (Neighbor-Joining method), позволяющими проводить бутстреп-анализ. Целесообразно использовать как минимум два разных алгоритма для постройки деревьев одного и того же семейства белков. При этом общие топологические свойства обоих деревьев будут являться более надёжными критериями для выводов о филогенетических взаимоотношениях между соответствующими белками. Бутстреп-анализ позволит оценить статистическую надёжность каждого из узлов построенного древа. Программа TreeView позволит получить графические изображения построенных деревьев.

Билет 15.

1. Проект «Геном человека». Основные черты организации генома человека.

Проект «Геном человека» – международная программа, целью которой являлось определение нуклеотидной последовательности (секвенирование) всей геномной ДНК человека, а также идентификация этих генов и их локализация в геноме (картирование).

В1990 году была создана Международная организация по изучению генома человека. 23 хромосомы человека были поделены между странами-участницами – в России исследовали структуры 3-й и 19-й хромосом (однако финансирование сократили и реального участия не было).

На расшифровку генома было выделено 15 лет, однако развитие секвенирования позволило закончить его на 2 года раньше. В начальные годы проекта секвенировали несколько миллионов нуклеотидных пар в год, а в конце 1999 года американская компания Celera расшифровывала не менее 10 млн нуклеотидных пар в сутки. Работа велась круглосуточно на автоматизированных установках, а информация сразу передавалась в базы данных, где систематизировалась и аннотировалась, а затем выкладывалась в интернет.

В1995 году Вентер разработал новый метод секвенирования – произвольное секвенирование методом дробления (шотган-метод), который позволял собрать полный геном из частично секвенированных фрагментов ДНК при помощи компьютерной модели.

Вфеврале 2001 года вариант генома человека (выполненный на 90%) был опубликован, а его анализ выявил около 25 тысяч генов (предполагалось, что это число в несколько раз больше, исходя из того, что один ген кодирует один белок). Сейчас считается, что один ген может кодировать 5-6 белков, а их многообразие обусловлено такими механизмами, как альтернативный сплайсинг, посттрансляционные превращения белков – фосфорилирование, ацетилирование и другие.

В2003 году был опубликован окончательный вариант полной последовательности генома человека.

Некоторые элементы генома не поддаются секвенированию. Оказалось, что лишь 30% генома кодируют белки и участвуют в регуляции действия генов. Около 10% составляют короткие элементы, обнаруженные только у приматов, и выполняющие неизвестную функцию. Многие гены были названы генами лишь по наличию знаков пунктуации, но их функции также не ясны. При этом финишная сборка даже референсного генома человека до сих пор не завершена, около 8% не секвенировано.

Практическое приложение:

Лечение генетических заболеваний. К настоящему времени в мире идентифицировано множество генов, ответственных за многие болезни человека, в том числе и такие серьезные, как болезнь Альцгеймера, муковисцидоз, мышечная дистрофия Дюшенна, хорея Гентингтона, наследственный рак молочной железы и яичников и др.

Идентификация новых генов и выявление среди них тех, которые обусловливают предрасположенность к тем или иным заболеваниям.

Фармакогенетика, которая изучает, как особенности строения ДНК могут повлиять на эффективность лечения

Идентификации личности – судебная экспертиза, установление отцовства, опознание останков погибших.

Этногеномика позволит выявлять генетические возможности этноса, что востребовано в истории, лингвистике и др. науках.

Палеогеномика, занимающаяся исследованием древней ДНК, извлеченной из останков, найденных в могильниках и курганах

Проекты International HapMap Project и 1000 геномов – гаплотипные карты

IGSR: The International Genome Sample Resource – публичный каталог вариаций генотипов и отдельных геномов человека, 2,504 обр. с 5-х мест Земли. Африк-ий, америк-ий, восточно-азиатский, европ-ий, южно-азиатский

«1000 геномов» — международный проект, в котором, как было объявлено в январе 2008 года, к концу 2011 года планировалось упорядочить геномы примерно 2500 человек, чтобы создать подробный каталог генетических вариаций человека, включая однонуклеотидные полиморфизмы, индели (это инсерция (т.е. вставка) или делеция ("выпадение" или удаление) участка в геноме), и структурные вариации, такие как вариации числа копий генов.

HAP MAP: является организацией, деятельность которой направлена на разработку карты гаплотипа (совокупность аллелей на локусах одной хромосомы, обычно наследуемых вместе) генома человека, чтобы описать общие закономерности наследственной генетической изменчивости людей.

HapMap используется, чтобы найти генетические варианты, влияющие на здоровье, болезнь и реакции на лекарственные препараты и факторы окружающей среды. Информация, получаемая в рамках проекта для проведения исследований находится в свободном доступе.

Показал, что более 90% всех SNP (однонуклеотидный полиморфизм) распространены среди таких географически различных популяций, как жители западной Африки, европейцы и восточные азиаты с частотами аллелей, аналогичными в разных популяциях. Этот факт указывает, что большинство SNP возникли очень давно, до волны эмиграции из Восточной Африки, заполнившей остальные части света. Определенная доля SNP тем не менее может иметь аллели, которые присутствуют в некоторых популяциях и отсутствуют в других, или выраженные различия в частотах между популяциями в разных частях света. Эти различия в частотах аллелей между популяциями, наблюдающиеся в небольшой доле SNP, могут быть результатом генетического дрейфа/эффекта родоначальника или отбора в отдельных географических регионах после миграции из Африки. Такие SNP, названные предковыми информационными маркерами, используют в исследованиях происхождения человека, миграций и потока генов. В некоторых случаях их использовали в судебных исследованиях для определения вероятной этнической