Слайд 2
Что такое DNA Computing?
DNA Logic — это технология ДНК-вычислений, которая сегодня находится в зачаточном состоянии, однако в будущем на нее возлагаются большие надежды. Биологические нанокомпьютеры, вживляемые в живые организмы, пока видятся нам как нечто фантастическое, нереальное. Но то, что нереально сегодня, уже завтра может оказаться чем-то обыденным и настолько естественным, что трудно будет представить, как без этого можно было обходиться в прошлом.
Вычисления на ДНК – это раздел области молекулярных вычислений, на границе молекулярной биологии и компьютерных наук.
Основная идея ДНК-вычислений – построение новой парадигмы вычислений, новых моделей, новых алгоритмов на основе знаний о строении и функциях молекулы ДНК и операций, которые выполняются в живых клетках над молекулами ДНК при помощи различных ферментов.
К перспективам ДНК-вычислений относится создание биологического нанокомпьютера, который будет способен хранить терабайты информации при объеме в несколько микрометров. Такой компьютер можно будет вживлять в клетку живого организма, а его производительность будет исчисляться миллиардами операций в секунду при энергопотреблении не более одной миллиардной доли ватта.
Слайд 3
Преимущества ДНК в компьютерных технологиях:
Использование не бинарного, а тернарного кода
Способность к одновременному вступлению в реакцию (к вычислениям) триллионов молекул ДНК.
Уже в силу этого ДНК-компьютеры могут производить вычисление на несколько порядков быстрее, чем самые быстрые современные суперкомпьютеры. Но вот вторая стадия - извлечение результатов вычислений - значительно более медленная и предусматривает выполнение нескольких этапов очень тщательного биохимического анализа.
Слайд 4
Основные сведения о молекуле ДНК
Молекула ДНК – двойная лента, составленная из четырех оснований: А (аденин), Т (тимин), Г (гуанин), Ц (цитозин).
Диаметр двойной спирали ДНК – 2нм
Расстояние между соседними парами оснований – 0.34 нм
ДНК вирусов содержит ~1000 звеньев
ДНК млекопитающих – до 1010 звеньев
Слайд 5
Молекула обладает следующими свойствами:
Комплементарность оснований заключается в том, что образование водородных связей при соединении одинарных цепочек ДНК в двойную цепочку возможно только между парами А - Т и Г - Ц.
Ренатурация – это соединение двух одинарных цепочек ДНК за счет связывания комплементарных оснований.
Денатурация – разъединение двойной цепочки и получение двух одинарных цепочек.
Слайд 6
Для различных манипуляций над ДНК-молекулами используются различные энзимы (ферменты). И точно так же, как современные микропроцессоры имеют набор базовых операций типа сложения, сдвига, логических операций AND, OR и NOT NOR, ДНК-молекулы под воздействием энзимов могут выполнять такие базовые операции, как разрезание, копирование, вставка и др. Причем все операции над ДНК-молекулами можно производить параллельно и независимо от других операций
Дополнение цепочки ДНК происходит при воздействии на исходную молекулу ферментов – полимераз. Для работы полимеразы необходимо наличие:
Одноцепочечной матрицы, которая определяет добавляемую цепочку по принципу комплементарности
Праймера (двухцепочечный участок)
Свободных нуклеотидов в растворе
Слайд 7
Существуют полимеразы, которым не требуются матрицы для удлинения цепочки ДНК. Например, терминальная трансфераза добавляет одинарные цепочки ДНК к обоим концам двухцепочечной молекулы.
Слайд 8
За укорочение и разрезание молекул ДНК отвечают ферменты – нуклеазы. Различают эндонуклеазы и экзонуклеазы. Экзонуклеазы осуществляют укорочение молекулы ДНК с концов:
Слайд 9
Сайт-специфичные эндонуклеазы – рестриктазы – разрезают молекулу ДНК в определенном месте, которое закодировано последовательностью нуклеотидов – сайтом узнавания.
Разрез может быть прямым, или несимметричным, как на рисунке. Разрез может проходить по сайту узнавания, или же вне его.
Эндонуклеазы разрушают внутренние фосфодиэфирные связи в молекуле ДНК.
Слайд 10
Сшивка - операция, обратная операции разрезания, происходит под воздействием ферментов – лигаз.
“Липкие концы” соединяются вместе с образованием водородных связей.
Лигазы служат для того, чтобы закрыть насечки, т.е. способствовать образованию в нужных местах фосфодиэфирных связей.
Слайд 11
Модификация используется для того, чтобы рестриктазы не смогли “найти” определенный сайт и не разрушили молекулу.
Существует несколько типов модифицирующих ферментов – метилазы, фосфатазы и т.д.
Метилаза имеет тот же сайт узнавания, что и соответствующая рестриктаза. При нахождении нужной молекулы, метилаза модифицирует участок с сайтом так, что рестриктаза уже не сможет идентифицировать эту молекулу.
Слайд 12
ПЦР.
(а) Нагреваем до температуры кипения воды
(б) Охлаждаем до 55o C
(в) Снова нагреваем до 70-72o C
Слайд 13
Секвенирование – это определение последовательности нуклеотидов в ДНК. Для секвенирования цепочек различной длины применяют различные методы. При помощи метода праймер-опосредованной прогулки удается на одном шаге секвенировать последовательность в 250-350 нуклеотидов.
После открытия рестриктаз стало возможным секвенировать длинные последовательности по частям.
Слайд 14
Гель-электрофорез используется для разделения молекул ДНК по длине
Если молекулы поместить в гель и приложить постоянное электрическое поле, то они будут двигаться по направлению к аноду, причем молекулы меньшей длины будут двигаться быстрее.
Молекулы ДНК имеют отрицательный заряд
Иногда применяют маркировочные молекулы
Слайд – 15 Биокомпьютер Эдлмана
В 1994 году Леонард Адлеман (Leonard Adleman) , профессор университета Южной Калифорнии, профессиональный математик и специалист по теории вычислений, продемонстрировал, что с помощью пробирки с ДНК можно весьма эффективно решать классическую комбинаторную «задачу о коммивояжере»
статья "Молекулярное вычисление решений для комбинаторных задач" ("Science", 11 ноября 1994 г.)
Слайд 16
Первоначально Эдлмэн использовал ДНК-компьютер для решения классической "задачи отыскания гамильтонова пути", иначе известной как "задача о путешествиях коммивояжера". Эта задача относится к так называемой теории графов – области дискретной математики, особенностью которой является геометрический подход к изучению объекта.
Этот вид задач связан с путешествиями вдоль графов, речь идет о задачах, в которых требуется отыскать путь, проходящий через все вершины, причем не более одного раза через каждую. Цикл, проходящий через каждую вершину один и только один раз, носит название гамильтоновой линии ( в честь Вильяма Роуэна Гамильтона, знаменитого ирландского математика прошлого века, который первым начал изучать такие линии).
Оказывается, что задача эта совсем не проста. Задача отыскания гамильтонова пути относится к числу трансвычислительных: уже при относительно небольшом числе городов (66 и более) она не может быть решена методом перебора вариантов никакими теоретически мыслимыми компьютерами за время, меньшее нескольких миллиардов лет.
Слайд 17
С увеличением числа вершин графов сложность решения задачи экспоненциально возрастает и становится трудновыполнимой не только для человека, но и для компьютера.
Так, на рис. показан граф из семи вершин с указанием возможных переходов между ними. Для поиска гамильтонова пути обычному человеку требуется не более одной минуты. Именно такой граф был использован в эксперименте Эдлмана. На следующем рис. представлен граф из 12 вершин — в этом случае поиск гамильтонова пути оказывается уже не такой простой задачей. Вообще, сложность решения задачи поиска гамильтонова пути возрастает экспоненциально с ростом числа вершин в графе. К примеру, для графа из 10 вершин существует 106 возможных путей; для графа из 20 вершин — 1012, а для графа из 100 вершин — 10100 вариантов. Понятно, что в последнем случае для генерации всех возможных путей и их проверки потребуется огромное время даже для современного суперкомпьютера.
Слайд 18
Задачу отыскания гамильтонова пути удобно рассматривать на примере путешествия коммивояжера. Итак, смысл задачи заключается в следующем: имеется несколько городов, которые необходимо посетить, причем побывать в каждом городе можно только один раз.
Зная пункт отправления и конечный пункт, необходимо определить маршрут путешествия (если он существует). При этом маршрут составляется с учетом возможных авиаперелетов и коннектов различных авиарейсов.
Для простоты понимания, предположим, что имеется всего четыре города (в эксперименте Эдлмана использовалось семь городов): Атланта (Atlanta), Бостон (Boston), Детройт (Detroit) и Чикаго (Chicago). Перед путешественником ставится задача выбрать маршрут, чтобы попасть из Атланты в Детройт, побывав при этом в каждом городе только один раз. Схемы возможных сообщений между городами показаны на рис.
Слайд 19
Процесс вычисления состоит из четырех этапов:
Сгенерировать все возможные маршруты.
Отобрать маршруты, которые начинаются в Атланте и заканчиваются Детройтом.
Выбрать маршруты, длина которых соответствует количеству городов (в нашем случае длина маршрута составляет четыре города).
Выбрать маршруты, в которых каждый город присутствует только один раз.
Слайд 21
Для решения данной задачи с использованием ДНК-вычислений Эдлман закодировал название каждого города в виде одной цепочки ДНК, причем каждая из них содержала 20 базовых оснований. Для простоты мы будем кодировать каждый город ДНК-цепочкой из восьми оснований. ДНК-коды городов показаны на рисунке. Обратите внимание, что цепочка длиной в восемь базовых оснований оказывается избыточной для кодирования всего четырех городов.
Отметим, что для каждого ДНК-кода города, который определяет одинарную ДНК-цепочку, существует и комплементарная цепочка, то есть комплементарный ДНК-код города, причем и ДНК-код города, и комплементраный код абсолютно равноправны.
Далее с помощью одинарных ДНК-цепочек необходимо закодировать все возможные перелеты (Атланта — Бостон, Бостон — Детройт, Чикаго — Детройт и т.д.). Для этого использовался следующий подход. Из названия города отправления брались четыре последних базовых основания, а из названия города прибытия — четыре первых.
К примеру, перелету Атланта — Бостон будет соответствовать следующая последовательность: GCAG TCGG