
Манило (метода)
.pdf
Рис. 3.3. График зависимости разностей значений Cq от логарифма концентрации РНК
Применим дисперсионный критерий, чтобы проверить, меняется ли экспрессия РНК А в экспериментальных группах (1 – молодые, 2 – взрослые, 3 – старые):
> o n e w a y . t e s t ( g e n e A _ d o ~ g r o u p , e x p ) $ p . v a l u e
[ 1 ] 0 . 6 8 1
Так как р-значение больше 0.05, то можно заключить, что уровни РНК А не меняются ни в одной из групп по отношению к остальным.
Построим график для визуализации распределения значений Cq в груп-
пах (рис. 3.4):
> s t r i p c h a r t ( g e n e A _ d o ~ g r o u p , x l i m = c ( 0 . 7 , 3 . 3 ) , y l i m =
c ( 2 0 , |
2 2 . 5 ) , |
y a x t = " n " , v e r t i c a l |
= T R U E , y l a b = " Значение |
C q " , |
x l a b = |
" Номер группы" , |
p c h = 1 9 ) |
> a x i s ( s i d e = 2 , a t = c ( 2 0 , 2 1 , 2 2 ) )
Рассчитаем и нанесем на график медианы Cq для каждой группы:
> m e d = t a p p l y ( g e n e A _ d o , g r o u p , m e d i a n , n a . r m = T ) ;
61

> m e d |
|
|
1 |
2 |
3 |
2 1 . 5 2 0 |
2 1 . 2 2 0 |
2 1 . 2 7 5 |
> s e g m e n t s ( 0 . 9 , |
m e d [ 1 ] , 1 . 1 , |
m e d [ 1 ] , l t y = |
1 , l w d = 4 ) |
|||||||
> |
s e g m e n t s ( 1 . 9 , |
m e d [ 2 ] , |
2 . 1 , |
m e d [ 2 ] , |
l t y |
= |
1 , |
l w d |
= |
4 ) |
> |
s e g m e n t s ( 2 . 9 , |
m e d [ 3 ] , |
3 . 1 , |
m e d [ 3 ] , |
l t y |
= |
1 , |
l w d |
= |
4 ) |
Рис. 3.4. Распределение значений Cq РНК А в группах
Поскольку разница эффективностей систем детекции для РНК А и Б мала и уровни РНК А не меняются в экспериментальных группах, то РНК А можно использовать в качестве референсной РНК для нормировки измеренных уровней РНК Б.
3.4.3.Поиск выбросов с помощью выявления образцов
ссильно отклоняющимися уровнями референсной РНК
Поскольку РНК А удовлетворяет условиям референсной РНК, то по отношению к ней образцы можно рассматривать как технические репликаты, и поэтому значения РНК А можно использовать для поиска выбросов. Причиной появления выбросов может быть, например, присутствие в некоторых образцах ингибиторов ПЦР.
Проведем анализ выбросов для двух выборок – g e n e A _ d o и g e n e A _ p o s . Построим диаграмму размахов значений Cq для каждой выборки (рис. 3.5):
62

> |
b = b o x p l o t ( c b i n d ( g e n e A _ d o , |
g e n e A _ p o s ) , y l a b = " Зна- |
|
чение C q " , x a x t = " n " ) |
|
|
|
> |
l a = a s . v e c t o r ( c ( " РНК А до" , |
" РНК А после" ) ) |
|
> a x i s ( 1 , a t = s e q ( 1 , 2 , b y = 1 ) , l a b e l s = l a , f o n t = |
1 ) |
Рис. 3.5. Распределение значений Cq РНК А в группах до и после экспериментального воздействия
Из графика видно, что группа g e n e A _ p o s имеет один потенциальный выброс, которым является образец, имеющий максимальное значение Cq. Определим объем выборки g e n e A _ p o s :
> l e n g t h ( g e n e A _ p o s )
[1] 25
Получим значение критерия Граббса для потенциального выброса. В расчетах используются стандартные математические функции – максимальное значение m a x ( ) , математическое ожидание m e a n ( ) , стандартное отклонение s d ( ) :
> ( m a x ( g e n e A _ p o s ) - m e a n ( g e n e A _ p o s ) ) / s d ( g e n e A _ p o s )
[1] 4.624
Рассчитанное значение 4.624 больше, чем 2.822 – критическое значение критерия Граббса для 25 измерений, поэтому отклоняющийся образец признаем выбросом.
63
Определим индекс образца, содержащего ингибиторы реакции амплификации, и исключим его из дальнейшего анализа:
> w h i c h ( g e n e A _ p o s = = b $ o u t )
[ 1 ] 1 0
>g e n e A _ p o s [ 1 0 ] = N A
>g e n e B _ p o s [ 1 0 ] = N A
3.4.4.Проверка условий нормальности распределения данных
иоднородности дисперсий
Убедиться в нормальности распределения данных можно с помощью критерия Шапиро–Уилка. В R данный тест реализуется с помощью функции s h a p i r o . t e s t ( ) . Указав в аргументах данной функции переменную, содержащую некоторую выборку данных, можно легко получить р-значение проверяемой гипотезы. Например, для переменной g e n e A :
> |
s h a p i r o . t e s t ( g e n e A _ d o ) $ p . v a l u e |
|
[ 1 ] |
0 . 1 1 7 |
|
> |
s h a p i r o . t e s t ( g e n e A _ p o s ) $ p . v a l u e |
|
[ 1 ] |
0 . 8 9 1 |
Проверка однородности дисперсий между парой групп с помощью критерия Фишера реализуется в R с помощью функции v a r . t e s t ( ) :
> v a r . t e s t ( g e n e B _ d o , g e n e B _ p o s ) $ p . v a l u e
[1] 0.112
Для проверки однородности дисперсий между тремя группами одновременно с помощьюкритерияБартлетта используем функцию bartlett.test():
> b a r t l e t t . t e s t ( g e n e B _ d o ~ g r o u p , e x p ) $ p . v a l u e
[ 1 ] 0 . 4 4 7
3.5.Изучение экспериментальных данных
3.5.1.Изучение различий в абсолютных уровнях исследуемой РНК до и после воздействия
Подготовка данных. В эксперименте перед проведением ПЦР в реальном времени была выполнена нормировка на общую РНК, поскольку в каждой реакции обратной транскрипции использовали ее одинаковое количество. Для решения рассматриваемой в данном разделе задачи дополнитель-
64
ная нормировка производиться не будет. Уровни РНК Б до и после воздействия измеряли у одних и тех же животных, поэтому данные связаны. Так как данные связаны и в первой выборке для 3-го и 4-го образцов, а во второй выборке для 10-го образца значения не определены или удалены (образцы имеют значение NA), то и парные с ними значения необходимо заменить на NA:
> g e n e B _ d o [ 1 0 ] = N A > g e n e B _ p o s [ 3 ] = N A > g e n e B _ p o s [ 4 ] = N A
Проверка гипотезы о равенстве средних значений в выборках. Для этого применим статистический критерий. В аргументах функции параметрического критерия Стьюдента t . t e s t ( ) помимо сравниваемых групп данных необходимо указать:
– информацию о том, связаны данные или нет: p a i r e d = { T R U E или
F A L S E } ;
– вид альтернативной гипотезы: a l t e r n a t i v e = { " t w o . s i d e d " или
" l e s s " или " g r e a t e r " } ;
– информацию об однородности дисперсий: v a r . e q u a l = { T R U E
или F A L S E } .
В аргументах функции непараметрического критерия Манна–Уитни или Вилкоксона w i l c o x . t e s t ( ) помимо сравниваемых групп данных необходимо указать:
– информацию о том, связаны данные или нет: p a i r e d = { T R U E , т. е. рассчитывается критерий Вилкоксона или F A L S E , при этом рассчитывается критерий Манна–Уитни};
– вид альтернативной гипотезы: a l t e r n a t i v e = { " t w o . s i d e d " или
"l e s s " или " g r e a t e r " } .
Врассматриваемом примере данные связаны, условие нормальности не нарушается и дисперсии равны, поэтому используем парный двухсторонний критерий Стьюдента для связанных образцов без поправки на неравенство дисперсий:
> t . t e s t ( g e n e B _ d o , g e n e B _ p o s , p a i r e d = T R U E , a l t e r n a - t i v e = " t w o . s i d e d " , v a r . e q u a l = T R U E ) $ p . v a l u e
[ 1 ] 0 . 0 0 0 5 0 4
Поскольку p-значение меньше 0.05, то гипотеза о равенстве средних значений отвергается.
65

Расчет индивидуальных абсолютных значений РНК Б в экспери-
ментальных образцах. Для расчета абсолютных значений воспользуемся построенной ранее моделью линейной регрессии:
> A Q _ d o = 1 0 ^ ( ( g e n e B _ d o - c o e f ( m B ) [ [ 1 ] ] ) / c o e f ( m B ) [ [ 2 ] ] ) > A Q _ p o s = 1 0 ^ ( ( g e n e B _ p o s -
c o e f ( m B ) [ [ 1 ] ] ) / c o e f ( m B ) [ [ 2 ] ] )
Рис. 3.6. Абсолютные значения уровней РНК Б в экспериментальных образцах
до и после экспериментального воздействия
Представим результаты расчетов на графике (рис. 3.6):
> A Q = c b i n d ( A Q _ d o , A Q _ p o s )
> p l o t ( A Q [ 1 , ] , y l i m = c ( 5 0 0 0 0 , 2 0 0 0 0 0 0 ) , x l i m =
c ( 0 . 5 , 2 . 5 ) , |
p c h = |
1 9 , |
l o g = |
" y " , y l a b = " Абсолютное |
|
значение" , |
x l a b |
= " |
" , x a x t |
= " n " , m a i n = " " ) |
|
> |
l i n e s ( A Q [ 1 , ] ) |
|
|
|
|
> |
f o r ( i i n 2 : 2 4 ) { |
|
|
|
p a r ( n e w = T R U E )
p l o t ( A Q [ i , ] , y l i m = c ( 5 0 0 0 0 , 2 0 0 0 0 0 0 ) , x l i m = c ( 0 . 5 , 2 . 5 ) , p c h = 1 9 , l o g = " y " , y l a b = " " , x l a b = " " , x a x t = " n " ,
y a x t = " n " , m a i n = " " ) l i n e s ( A Q [ i , ] ) }
66
> t e x t ( x = 1 . 5 , y = 1 5 0 0 0 0 0 , l a b e l s = " p = 0 . 0 0 0 5 " , f o n t = 3 )
>l a = a s . v e c t o r ( c ( " До воздействия" , " После воздействия" ) )
>a x i s ( 1 , a t = s e q ( 1 , 2 , b y = 1 ) , l a b e l s = l a , f o n t = 1 )
3.5.2.Изучение различий в относительных уровнях исследуемой РНК
вразных возрастных группах
Проверка гипотезы о равенстве средних значений в трех возрастных группах. Перед применением статистического критерия выполним нормировку индивидуальных значений Cq РНК Б для каждого образца с использованием значений Cq референсной РНК, как это описано в работе Митчелла и соавторов [12]. Для этого рассчитаем нормированные значения следующим образом: CqРНК_Б норм = CqРНК_Б – (CqРНК_А – CqРНК_А медиана), где
CqРНК_Б – Cq РНК Б рассматриваемого образца, CqРНК_А – Cq РНК А этого
же образца, CqРНК_А медиана – медиана Cq РНК А всех образцов. Нормированные значения CqРНК_Б норм запишем в переменную geneB_do_norm:
> g e n e B _ d o _ n o r m < - c ( 3 2 . 6 8 , 3 0 . 2 7 , N A , N A , 2 9 . 6 9 ,
3 1 . 7 1 , 3 2 . 3 5 , 3 0 . 7 4 , 3 1 . 0 4 , 3 0 . 0 7 , 3 0 . 0 7 , 3 0 . 9 7 , 3 0 . 5 7 , 2 8 . 8 9 , 2 9 . 5 8 , 3 0 . 8 4 , 2 9 . 8 2 , 3 0 . 0 2 , 2 9 . 2 8 , 2 8 . 7 1 , 2 8 . 1 9 , 2 8 . 2 4 , 2 8 . 6 9 , 2 8 . 6 0 , 2 7 . 4 3 )
Поскольку данные в выборках не связаны, используем парный двухсторонний критерий Стьюдента для несвязанных образцов без поправки на неравенство дисперсий, так как условие нормальности не нарушается и дисперсии равны. Применим критерий Стьюдента для попарного сравнения групп. Чтобы учесть множественные сравнения необходимо в аргументе функции указать p.adjust.method = {bonferroni или BH или BY} для применения попра-
вок Бонферрони, Беньямини–Хохберга или Беньямини–Йекутили соответственно. В данном случае будет произведено три парных сравнения, поэтому используем поправку Бонферрони. Получим матрицу р-значений:
> |
p a i r w i s e . t . t e s t ( g e n e B _ d o _ n o r m , g r o u p , p . a d j u s t . m e t h o d |
= |
" b o n f e r r o n i " ) |
|
1 |
2 |
2 |
0.1104 |
– |
3 |
7e-05 |
0.0047 |
67
Результаты расчета показывают, что р-значение при сравнении групп 1 и 2 больше 0.05, поэтому гипотеза о равенстве средних значений принимается. При сравнении двух оставшихся пар групп р-значение меньше 0.05, поэтому для них гипотезы о равенстве средних значений отвергаются.
Расчет средних относительных количеств РНК Б в трех возрастных группах. Выполним расчет средних относительных количеств РНК Б с по-
мощью метода 2(– Cq) [13]. Определим переменные:
>r e f = g e n e A _ d o # значения C q референсной РНК
>t a r = g e n e B _ d o # значения C q исследуемой РНК
Найдем разницу между Cq исследуемой и референсной РНК для каждого образца и таким образом выполним нормировку:
> d c q = t a r – r e f ; d c q
Усредним по группам нормированные значения:
> m e a n s . d c q = t a p p l y ( d c q , g r o u p , m e a n , n a . r m = T ) ; m e a n s . d c q
Найдем групповые стандартные отклонения:
> s d = t a p p l y ( d c q , g r o u p , s d , n a . r m = T ) ; s d
Примем за единицу среднее количество РНК Б в группе 1 и вычислим относительные количестваРНК Б в группах 2 и 3. Для этого сначала рассчитаем Cq:
> d d c q = m e a n s . d c q – m e a n s . d c q [ 1 ]
а затем относительные количества
> r q = 2 ^ - d d c q ; r q
Загрузим и установим в R дополнительные пакеты, необходимые для использования функций b a r p l o t 2 ( ) и p l o t C I ():
>i n s t a l l . p a c k a g e s ( " g p l o t s " )
>l i b r a r y ( g p l o t s )
Представим результаты расчетов графически четырьмя разными способами. На рис. 3.7, а представлена точечная диаграмма, где точки соответствуют средним значениям, а «усы» – стандартному отклонению:
> p a r ( m f r o w = c ( 1 , 4 ) )
68

> p l o t C I ( x = c ( 1 : 3 ) , y = r q , u i w = ( 2 ^ - ( d d c q - s d ) ) - 2 ^ -
d d c q , l i w = ( 2 ^ - d d c q ) - 2 ^ - ( d d c q + s d ) , x l i m = c ( 0 . 7 , 3 . 3 ) ,
y l i m |
= |
c ( 0 , 1 5 ) , p c h = 1 9 , x l a b = " Группа" , |
x a x t = " n " , |
y l a b |
= |
" Относительное количество" , l w d = |
2 , m a i n = " " ) |
Укажем на графике названия групп:
> l a = a s . v e c t o r ( c ( " 1 " , " 2 " , " 3 " ) )
> a x i s ( 1 , a t = s e q ( 1 , 3 , b y = 1 ) , l a b e l s = l a , f o n t = 1 )
Укажем на графике р-значения для соответствующих пар групп: > l i n e s ( c ( 1 , 1 , 2 , 2 ) , c ( 4 . 7 , 5 , 5 , 4 . 7 ) , l w d = 2 )
> t e x t ( x |
= 1 . 5 , y |
= 5 . 8 , l a b e l s = " p = 0 . 1 1 0 4 " , f o n t = 3 ) |
> l i n e s ( c ( 2 , 2 , 3 , 3 ) , c ( 1 1 . 7 , 1 2 , 1 2 , 1 1 . 7 ) , l w d = 2 ) |
||
> t e x t ( x |
= 2 . 5 , y |
= 1 2 . 8 , l a b e l s = " p = 0 . 0 0 4 7 " , f o n t = 3 ) |
На рис. 3.7, б те же данные средних относительных количеств представлены в виде столбчатой диаграммы:
> b a r p l o t 2 ( 2 ^ - d d c q , p l o t . c i = T R U E , c i . l = 2 ^ - ( d d c q + s d ) , c i . u = 2 ^ - ( d d c q - s d ) , n a m e s . a r g = c ( " 1 " , " 2 " , " 3 " ) , y l a b = " Относительное количество" , x l a b = " Группа" , c o l = " g r e y " , l a s = 2 , c e x . a x i s = 0 . 7 , y l i m = c ( 0 , 1 5 ) , m a i n = " " )
Рис. 3.7. Способы представления результатов расчетов:
а– точечная диаграмма; б – столбчатая диаграмма; в – боксплот;
г– диаграмма рассеяния с указанием значений Cq в индивидуальных образцах
Укажем на графике р-значения для соответствующих пар групп:
> l i n e s ( c ( 1 , 1 , 2 , 2 ) , c ( 4 . 7 , 5 , 5 , 4 . 7 ) , l w d = 2 )
> t e x t ( x = 1 . 5 , y = 5 . 8 , l a b e l s = " p = 0 . 1 1 0 4 " , f o n t = 3 )
69
> l i n e s ( c ( 2 , 2 , 3 , 3 ) , c ( 1 1 . 7 , 1 2 , 1 2 , 1 1 . 7 ) , l w d = 2 )
> t e x t ( x = 2 . 5 , y = 1 2 . 8 , l a b e l s = " p = 0 . 0 0 4 7 " , f o n t = 3 )
На рис. 3.7, в боксплоты иллюстрируют распределения нормированных значений Cq по группам:
> b o x p l o t ( g e n e B _ d o ~ g r o u p , n a m e s = c ( " 1 " , " 2 " , " 3 " ) , x l a b = " Группа" , y l a b = " Значение C q " , m a i n = " " )
На рис. 3.7, г нормированные значения Cq в индивидуальных образцах представлены в виде диаграммы рассеяния:
> |
s t r i p c h a r t ( g e n e B _ d o ~ g r o u p , m e t h o d = " s t a c k " , v e r t i c a l |
= |
T R U E , x l a b = " Группа" , y l a b = " Значение C q " , |
x l i m = c ( 0 . 6 , 3 . 4 ) , p c h = 1 9 , c e x = 1 , m a i n = " " )
3.5.3.Изучение связи между уровнем исследуемой РНК
ивозрастом животных
Проанализируем связь между уровнем РНК Б до применения воздействия и возрастом животных из групп 1 и 2. В качестве оценки уровня РНК Б будем использовать рассчитанные ранее абсолютные значения. Отберем значения, соответствующие животным из групп 1 и 2:
>a g e 1 2 = a g e [ 1 : 1 6 ]
>A Q _ d o 1 2 = A Q _ d o [ 1 : 1 6 ]
Поскольку значения РНК Б для 3-го и 4-го образцов не определены, то и парные им значения возраста необходимо заменить на NA:
> a g e 1 2 [ 3 ] = N A ; a g e 1 2 [ 4 ] = N A
Вычисляем логарифм абсолютных значений уровней РНК Б: > l A Q _ d o 1 2 = l o g 2 ( A Q _ d o 1 2 )
Применим корреляционный анализ, чтобы количественно оценить силу связи двух параметров и значимость полученной оценки. Рассчитаем коэффициент корреляции Пирсонаи его фактическийуровеньзначимости (р-значение):
> c o r . t e s t ( a g e 1 2 , l A Q _ d o 1 2 , m e t h o d = " p e a r s o n " ) p - v a l u e = 0 . 0 0 0 7
c o r 0 . 7 9
Отобразим результаты анализа на графике (рис. 3.8):
70