Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лалала.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
145.88 Кб
Скачать

Министерство образования Российской Федерации

Научно-Исследовательский Ядерный Унивверситет “МИФИ”

Кафедра информатики и процессов управления

ОЦЕНКА НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЫ

на тему

<<Разработка алгоритмов и программ для сравнительного анализа геномов позволяющие определять функциональнык, в частности регуляторные сегменты геномов>>

Преподаватель

Степанова Елена Борисовна

Выполнил студент группы К7-172

Мозгов Дмитрий Александрович

Москва

2013

Технико-экономическая оценка рыночного потенциала полученных результатов

Расчеты и проведённые исследования, приведённые в отчёте, позволяют сделать вывод, что стоимость представленного на оценку объекта интеллектуальной собственности по состоянию на 31 октября 2012 года составляет

4 936 600,08 рублей

(Четыре миллиона девятьсот тридцать шесть тысяч шестьсот рублей 8 копеек)

1.1 Описание объекта оценки

I. Комплекс программ (ИПК) CORECLUST, предназначенный для поиска РМ в геномах

эукариот с учетом их регуляторной структуры и консервативности, а также описания

статистических свойств найденных РМ и оценки консервативности РМ, найденных в группах геномных последовательностей. ИПК содержит две части — серверную и клиентскую.

Серверная часть ИПК CORECLUST состоит из трех программных компонентов:

-- программного компонента CORECLUST-train для оценки параметров вероятностных

моделей РМ, который решает задачу оптимизации параметров скрытой Марковской модели, описывающей последовательность, содержащую РМ, алгоритмом максимизации ожидания;

-- программного компонента CORECLUST-search для поиска РМ в геномных

последовательностях, решающего задачу поиска РМ в данных геномных

последовательностях, используя для этого предоставленную ему модель РМ;

-- библиотеки классов CMP_GENOMICS, решающей в том числе задачу оценки

консервативности РМ, найденных в группе родственных последовательностей.

Клиентская часть включает:

- модуль доступа через веб-интерфейс, предназначенный для загрузки

пользовательских данных на вход программе, запуска программы и визуализации результатов.

Все программные элементы и их компоненты прошли успешно тесты.

С помощью разработанной методики было исследована структура предсказанных регуляторных модулей генов раннего развития плодовой мушки. Сравнение с другими известными программами показало, что CORECLUST опережает другие программы почти по всем мерам. Особенно примечательно, что CORECLUST показывает себя наилучшим образом по мерам CC, PC и ASP, которые учитывают ошибки как первого, так и второго рода. Не очень высокая чувствительность предсказания CORECLUST может объясняться тем, что, несмотря на принадлежность к одной системе, некоторые гены, представленные в выборке,

возможно, отличаются по структуре своих регуляторных участков от большинства. Поскольку обучение программы осуществляется на всех последовательностях выборки, то модель регуляторных участков отражает структуру, наиболее представленную во всей выборке. На уровне мотивов предсказания CORECLUST, напротив, показал довольно высокую чувствительность. По значениям специфичности, PPV и других характеристик CORECLUST показывает средние результаты. Однако, стоит помнить, что специфичность, как и PPV, в

данной области предсказаний всегда недооценивается, поскольку экспериментальные данные по участию ТФ в регуляции могут быть не полными.

Тестирование CORECLUST на системе мышечных генов позвоночных и системе

раннего развития плодовой мушки показало, что программа применима к различным

системам и организмам и может быть успешно использована для решения стандартной задачи поиска регуляторных участков для набора системо-специфичных ТФ.

Тестирование разработанной программы на двух хорошо изученных биологических системах (системе генов позвоночных, специфически экспрессирующихся в мышечной ткани, и системе раннего развития Drosophila) показало, что программа применима к различным системам и организмам и может быть успешно использована для решения стандартной задачи поиска регуляторных участков для набора системо-специфичных ТФ с качеством, превышающим качество предсказания других известных программ, решающих аналогичную задачу. Продемонстрировано, что учет структурных особенностей регуляторных модулей

позволяет выявлять правильные (то есть подтверждающиеся известными) регуляторные модули. Более того, регуляторные модули, найденные алгоритмом, учитывающим все рассмотренные аспекты регуляторной структуры, более консервативны, что может служить аргументом в пользу более высокой надежности этих предсказаний.