Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Манило (метода)

.pdf
Скачиваний:
160
Добавлен:
25.12.2019
Размер:
2.73 Mб
Скачать

показывает направление связи: если r 0 , то говорят о прямой корреляции (с увеличением одной переменной другая также возрастает), а если r 0 – об обратной корреляции (с увеличением одной переменной другая уменьшается).

Рассмотрим два широко применяемых критерия для оценки коэффициента корреляции. Пусть для одних и тех же объектов измерены значения двух различных параметров X i и Yi , При этом k-му объекту исследования соот-

ветствуют значения Xk и Yk в каждой из совокупностей.

Коэффициент корреляции Пирсона является параметрическим крите-

рием. Дополнительное условие использования данного критерия – линейность связи двух количественных признаков. Коэффициент корреляции Пирсона вычисляется по формуле

 

Xi

 

 

Yi

 

 

 

r

 

X

Y

,

Xi

 

 

2 Yi

 

2

 

X

Y

 

где X i , Yi – значениядлядвухвыборок; X , Y – выборочныесредниезначения.

Коэффициент ранговой корреляции Спирмена непараметрический аналог корреляции Пирсона и используется, когда связь нелинейная. В данном случае коэффициент корреляции вычисляется по формуле

n

n3 n ,

r 1 6 di2

i 1

 

где di rXi rYi – разность рангов для соответствующих значений в двух

выборках; n – объем каждой из выборок.

Поскольку расчет коэффициента корреляции основывается на выборочных данных, то сам коэффициент корреляции в этом случае является случайной величиной. Поэтому кроме получения значения коэффициента корреляции также необходимо определить его статистическую значимость. Коэффициент корреляции может быть признан незначимым, например в связи с небольшим числом наблюдений. При этом само значение коэффициента корреляции r может быть достаточно большим (рис 1.9).

Для определения статистической значимости коэффициента корреляции используется t-критерий с нулевой гипотезой о том, что r = 0, в то время как альтернативная гипотеза t-критерия будет r 0. Использование данного критерия для определения статистической значимости полученного значение коэффициента корреляции основано на предположении, что при истинности нулевой

31

Рис. 1.9. Влияние размера выборки на значимость коэффициента корреляции,

где r – коэффициент корреляции Пирсона, а p p-значение

гипотезы истинное значение коэффициента корреляции распределено по нормальному закону. Далее рассчитывается значение t-критерия для r и размера

каждой из двух выборок данных n по формуле t r

n 2

1 r2 и сравнива-

ется с критическим значением для требуемого уровня значимости (двухстороннего критерия) и числа степеней свободы df n 2 . Нулевая гипотеза о равенстве коэффициента корреляции нулю принимается, если t tкр, в противном

случае принимаетсягипотеза о значимости коэффициента корреляции.

1.6.Линейный регрессионный анализ

Внекоторых исследовательских задачах требуется не только определить наличие и значимость связи двух параметров, но и вычислить значение одного из параметров на основании измеренного значения второго параметра. Для этого недостаточно описать зависимость между двумя параметрами лишь количественно с помощью коэффициента корреляции. Необходимо знать вид закона (уравнения, системы уравнений), с помощью которого можно описать данную зависимость. Методом, позволяющим определить вид такого закона, является регрессионный анализ, а вид закона, наиболее подходящего для описания имеющейся зависимости, называется регрессионной моделью. Исследователь сам выбирает вид регрессионной модели, с помощью которой может быть описана зависимость двух параметров – линейной или нелинейной (параболической или другой, более сложной).

Для определения вида зависимости значение одной переменной задает

сам исследователь (поэтому она называется независимой), а значение второй

32

Рис. 1.10. Принцип построения линии регрессии

(зависимой переменной) регистрируется в результате эксперимента. Значения независимой переменной откладываются по оси X, а зависимой – по оси Y. В случае, когда анализируемая зависимость линейна, для нахождения уравнения прямой исполь-

зуют модель линейной регрессии. Линия регрессии проходит таким образом, чтобы минимизировать сумму квадратов остатков i , т. е. расстояний от всех значений yi до прямой (рис. 1.10).

Метод расчета уравнения прямой для линии регрессии проиллюстрирован на рис. 1.10. Пусть линейная связь описывается уравнением

y 0 1x ,

где y – зависимая переменная; 0 – значение на оси Y, в котором данная прямая эту ось пересекает; 1 – коэффициент наклона линии регрессии; x – независимая переменная. Чтобы найти оценки коэффициентов 0 и 1 для данного уравнения, используем формулы, полученные в соответствии с методом наименьших квадратов

 

 

 

n

n

 

 

 

 

 

 

 

 

 

y

x

 

 

 

 

 

 

 

n

 

 

 

i

 

i

n

 

 

 

2

 

yi xi

i 1

i 1

 

xi x

 

1

 

 

 

 

,

 

 

n

 

 

i 1

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 y 1 x ,

 

 

 

 

 

 

где yi и xi – значения независимой и зависимой переменной соответственно

для i-го измерения; n – число измерений; x и y – средние значения параметров

X и Y соответственно. Таким образом, получим уравнение линии регрессии y 0 1 x .

Чтобы определить, насколько хорошо линия регрессии описывает зависимость между двумя переменными, рассчитываюткоэффициент детерминации

R2 1 TSSESS ,

33

n

yi yi 2 сумма квадратов остатков;

 

где ESS

yi – истинные значения

i 1

 

 

функции; yi

– значения полученного уравнения

регрессии в точках xi ;

TSS n yi y 2 общая сумма квадратов. Коэффициент детерминации

i1

R2 изменяет свое значение в пределах от 0 до 1 и показывает, какая доля изменчивости зависимой переменной Y объясняется полученной линией регрессии, т. е. насколько хорошо зависимость между двумя переменными опи-

сывается полученным уравнением. Если R2 0 , то полученное уравнение не подходит для описания взаимоотношения двух переменных, так как полностью не определяет изменчивость значений параметра Y. Если коэффициент

R2 1, то значения данных полностью попадают на линию регрессии, т. е. вся изменчивость переменной Y объясняется полученной линейной моделью. По сути, коэффициент детерминации – это квадрат коэффициента корреляции, тем не менее, второй характеризует именно силу связи двух параметров.

Доверительный интервал для линии регрессии и ее коэффициентов.

В случаях, когда коэффициенты линии регрессии участвуют при расчете ка- ких-либо других показателей, важно помнить, что 0 и 1 лишь оценки коэффициентов регрессии 0 и 1. Так может возникнуть вопрос, в каком диа-

пазоне лежит истинное значение каждого из двух коэффициентов. Предполагая, что искомые коэффициенты распределены по нормальному закону (с некоторым средним и дисперсией), доверительные интервалы для истинных значений 0 и 1 находим как

0 t , n 2 s 0 0 0 t , n 2 s 0 ,

1 t ,n 2 s 1 1 1 t ,n 2 s 1 ,

где t – критическое значение критерия Стьюдента. Стандартные ошибки ко-

эффициентов регрессии s

и s

можно найти по формулам

0

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

s 0

 

 

 

s

 

 

 

 

,

 

 

 

 

n 1

sx

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

2

 

 

 

s

s

 

 

 

 

x

 

,

 

n

 

 

 

 

 

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

sx

 

34

 

1

n

yi yi 2 – остаточное стандартное отклонение; sx2 – дис-

где s

 

 

 

n 2 i 1

 

персия независимой переменной; sx – стандартное отклонение независимой

переменной.

Неопределенность линии регрессии характеризуется стандартной ошибкой регрессии sy , которая для разных xi принимает разные значения. Чем дальше xi

отстоит от выборочного среднего x , тем больше величина sy . Так, стандартное отклонениедлялиниирегрессиинаходитсядлякаждого xi изсоотношения

 

 

1

 

xi

 

2

.

s

s

 

x

n

 

 

2

y

 

 

 

 

 

 

 

 

 

 

n 1

sx

Из условий применения линейного регрессионного анализа известно, что для любого значения независимой переменной xi значения зависимой переменной

yi распределены нормально, при этом

средним является значение полученного уравнения регрессии yi. Таким образом,

доверительный интервал для значений уравнениярегрессии в точках xi :

y t

s

y y

t

s .

 

i

, n 2

y

i

i

, n 2

y

 

 

 

i

 

 

 

i

 

Затем полученные точки верхних и

Рис. 1.11. Использование линейной

нижних границ доверительных интерва-

регрессионноймодели

лов для каждого

yi

соединяются в ли-

иеедоверительного интервала

нии. На рис. 1.11 черные точки соответ-

для определения неизвестного

значения переменной x1

ствуют значениям переменных в экспе-

на основании измеренного

риментальных образцах,

кружки

соот-

значения переменной y1

ветствуют границам доверительных интервалов, а штриховые линии указывают границы доверительного интервала,

в котором с заданной вероятностью лежит истинная линия регрессии. Доверительный интервал для линии регрессии показывает, в каком

диапазоне для каждого значения независимой переменной xi находится соответствующее ему значение зависимой переменной yi с заданным уровнем доверия.

35

Глава 2. ПРИМЕНЕНИЕ ПОЛИМЕРАЗНОЙ ЦЕПНОЙ РЕАКЦИИ В РЕАЛЬНОМ ВРЕМЕНИ ДЛЯ ИЗМЕРЕНИЯ КОЛИЧЕСТВА МОЛЕКУЛ РНК В БИОЛОГИЧЕСКОМ ОБРАЗЦЕ

2.1. Определение количества молекул РНК в биологическом образце как подход для изучения функционального состояния клеток

Жизнедеятельность организма определяется функционированием его клеток. Нарушение функций клеток вызывает развитие заболеваний. В свою очередь, функциональное состояние клеток зависит от происходящих в них процессов. Например, процесс взаимодействия белков клеточного скелета друг с другом необходим для сокращения мышечных клеток. Каждый клеточный процесс определяется совокупностью молекулярных взаимодействий, ключевыми участниками которых являются белки и регуляторные некодирующие РНК. Для синтеза белков необходим промежуточный шаг – образование кодирующих их матричных РНК. Таким образом, присутствие в клетке определенного набора молекул общей РНК (матричных РНК и регуляторных некодирующих РНК) во многом определяет ее функциональное состояние (рис. 2.1).

Рис. 2.1. Матричные и некодирующие РНК

Рис. 2.2. Молекулы РНК

как регуляторы функционального

как потенциальные регуляторы

состояния клеток

и биомаркеры заболеваний

Молекулы РНК, количество которых изменяется при переходе клеток из одного функционального состояния в другое, являются кандидатами на роль регуляторов и/или биомаркеров такого перехода (рис. 2.2). Поэтому измерение количества молекул РНК – один из первых необходимых шагов на пути изуче-

36

ния роли этих молекул в нарушении функционирования клеток, а также поиска новых биомаркеров заболеваний. Современная молекулярная биология располагает целым арсеналом методов для определения количества копий молекул РНК в экспериментальном образце. Наибольшими чувствительностью, динамическим диапазоном и точностью измерения количества молекул РНК обладает метод полимеразной цепной реакции (ПЦР) в реальном времени [8]. Поэтому именно этот метод применяется, когда главной задачей исследования служит максимально точное определение абсолютного или относительного количества молекул РНК с известной нуклеотидной последовательностью. В следующем разделе будет рассмотрен принцип и основные этапы определения количества молекул РНК с помощью ПЦР в реальном времени, а для более подробного знакомства с особенностями этого методаможно рекомендовать [9].

2.2. Принцип измерения количества молекул РНК методом полимеразной цепной реакции в реальном времени

2.2.1. Обратная транскрипция и полимеразная цепная реакция

Материалом для измерения количества копий конкретной исследуемой РНК (РНК-мишени) служит препарат общей РНК, выделенной из клеток биологического образца. Процедура измерения количества молекул конкретной РНК в препарате общей РНК включает две последовательные ферментативные реакции – обратную транскрипцию (ОТ) и амплификацию с помощью полимеразной цепной реакции. Эти реакции протекают при определенных температурах в пробирках, содержащих все необходимые компоненты для матричного синтеза нуклеиновых кислот. Для точного поддержания температур, а также для выполнения быстрого перехода от одной температуры к другой используется программируемый термостат. Рассмотрим подробнее процессы, происходящие в ходе обратной транскрипции и ПЦР.

На стадии обратной транскрипции с помощью определенного фермента – РНК-зависимой ДНК-полимеразы, ДНК синтезирует копии молекул РНК. Для этого в реакционную смесь добавляют праймер – одноцепочечный ДНК-олигонуклеотид, который комплементарен участку исследуемой молекулы РНК. При температуре, когда энергии теплового движения молекул становится недостаточно для разрыва водородных связей между двумя комплементарными нуклеиновыми кислотами – праймером и РНК-мишенью, происходит их взаимодействие, которое называют отжигом. После отжига РНК-зависимая ДНК-полимераза взаимодействует с 3'-OH-концом праймера

37

и, используя присутствующие в растворе «строительные блоки» (дезоксинуклеотидтрифосфаты), катализирует синтез молекулы ДНК, комплементарной РНК-мишени, которую называют кДНК. Как правило, этап обратной транскрипции нацелен на построение ДНК-копий всех находящихся в растворе молекул РНК, поэтому на этой стадии в качестве праймеров используют набор коротких олигонуклеотидов, как правило гексамеров, нуклеотидные последовательности которых формируются случайным образом и поэтому представляют все возможные варианты последовательностей из шести нуклеотидов. Такие олигонуклеотиды называют случайными праймерами (СП). Случайные праймеры связываются со многими участками в каждой из молекул РНК, обеспечивая таким образом обратную транскрипцию всех присутствующих в образце молекул РНК. В результате для каждой молекулы РНК образуется одна копия кДНК (рис. 2.3).

Рис. 2.3. Схема этапов реакции синтеза молекул кДНК

Продукт обратной транскрипции используют в качестве матрицы на следующей стадии – амплификации ДНК с помощью ПЦР. На этой стадии с помощью другого фермента – ДНК-зависимой ДНК-полимеразы происходит синтез дополнительных копий (амплификация) конкретных молекул ДНК. Целью служит амплификация конкретной исследуемой молекулы ДНК (т. е. молекулы ДНК, имеющей определенную нуклеотидную последовательность). Амплификация, как правило, происходит в растворе, содержащем множество других молекул ДНК. Чтобы отличить исследуемую ДНК от остальных, используют специфичные праймеры длиной около 20 нуклеотидов, которые комплементарны только участкам последовательности исследуемой ДНК и, таким образом, обеспечивают специфичность реакции.

38

Первым шагом является денатурация образца посредством нагревания до 95 ºС. В результате чего все двухцепочечные структуры, образованные комплементарными последовательностями нуклеиновых кислот, разрушаются. Отжиг специфичных праймеров, т. е. их взаимодействие с комплементарными участками кДНК, происходит при охлаждении реакционной смеси до 60 ºС. На следующем этапе, который называется элонгация, или удлинение цепи, ДНК-зависимая ДНК-полимераза распознает 3'-OH-конец праймера и катализирует синтез новой цепи ДНК. Последовательность этих трех этапов (денатурация, отжиг, элонгация) называют циклом. В первом цикле с кДНК взаимодействует только один из праймеров (прямой). Начиная со второго цикла, когда появляется цепь ДНК, комплементарная кДНК, оба праймера (прямой и обратный) участвуют в реакции.

Рис. 2.4. Схема этапов ПЦР: П – прямой праймер, О – обратный праймер

При этом все присутствующие в растворе цепи ДНК служат матрицами для следующего цикла амплификации, поэтому теоретически количество продукта после каждого цикла должно удваиваться (рис. 2.4). Обычно реакция состоит из 20…40 циклов. Описание такой реакции по амплификации конкретного фрагмента ДНК, ограниченного парой праймеров, было впервые опубликовано в 1985 г. и получило название ПЦР [10]. Текущее количество наработанных копий ДНК, комплементарных исследуемой РНК, зависит от начального количества молекул РНК-мишени. Поэтому, зная эту зависимость и измерив количество наработанных копий ДНК, можно вычислить начальное количество исследуемой РНК-мишени.

39

2.2.2. Детекция продуктов ПЦР

Количество продукта ПЦР можно измерять в конце всей реакции (т. е. конечной точке) или по окончании каждого из циклов реакции (т. е. в реальном времени). Последняя методика получила название количественная ПЦР в реальном времени. Она позволяет строить кинетическую кривую ПЦР – график зависимости количества продукта от номера цикла. К распространенным подходам для определения количества молекул продукта после каждого цикла относится амплификация в присутствии интеркалирующих красителей. Интеркалирующий краситель количественно взаимодействует с двухцепочечной ДНК, после чего интенсивность его флуоресценции значительно увеличивается (рис. 2.5).

Рис. 2.5. Схема, иллюстрирующая увеличение суммарной интенсивности флуоресценции интеркалирующего красителя по мере увеличения

в растворе количества копий двухцепочечной ДНК (серый круг – молекула интеркалирующего красителя в растворе, серая звездочка – молекула интеркалирующего красителя, связавшаяся с двухцепочечной ДНК)

Поэтому суммарная интенсивность флуоресценции интеркалирующего красителя, которую называют репортерной флуоресценцией, прямо пропорциональна присутствующему в реакции в данный момент количеству копий двухцепочечной ДНК. Таким образом, измерение интенсивности флуоресценции интеркалирующего красителя позволяет определить количество копий двухцепочечной ДНК, присутствующих в реакции после каждого цикла.

2.2.3. Зависимость количества наработанных копий исследуемой РНК от номера цикла ПЦР

Пусть есть два образца общей РНК, причем в образце А исходное количество исследуемой РНК-мишени больше, чем в образце Б. Выполним обратную транскрипцию и амплифицируем фрагменты кДНК, комплементарные исследуемой РНК-мишени с помощью ПЦР в реальном времени. Измерив интенсивность репортерной флуоресценции, определим количество копий

40