Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методическое пособие 764

.pdf
Скачиваний:
14
Добавлен:
30.04.2022
Размер:
8.28 Mб
Скачать

Рис. 2. Количествопогибших на пожарах во Вьетнаме (2006-2015 гг.)

Рис. 3. Количество раненых на пожарах во Вьетнаме (2006-2015 гг.)

Рис. 4. Размер ущерба от пожаров (мил. долл.)во Вьетнаме (2006-2015 гг.)

41

Таблица 2

Статистика причин пожаровво Вьетнаме (2006-2015 гг.)

 

 

Причины пожаров

 

 

 

 

 

 

 

 

 

 

 

 

Неосторожное

Наруше-

Стихийные

Умышленные

Техноген-

Иные

при-

 

 

обращение с

ние правил

бедствия

поджоги

ные причи-

чины

 

Годы

пожаровЧисло

огнѐм

 

пожарной

Число пожаров

 

Число пожаров

 

ны

 

Число пожаров

 

Число пожаров

 

Число пожаров

 

 

 

Число пожаров

 

 

 

 

 

 

безопасно-

 

 

 

 

 

 

 

 

 

 

 

 

 

сти

 

 

 

 

 

 

 

 

 

 

 

 

 

В%

 

В%

 

В%

 

В%

 

В%

 

 

В%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2006

1935

801

41,40

134

6,93

110

5,68

195

10,08

509

26,30

186

 

9,61

2007

2002

863

43,12

157

7,84

123

6,14

196

9,79

505

25,22

158

 

7,89

2008

1950

855

43,84

108

5,54

69

3,54

148

7,59

577

29,59

193

 

9,90

2009

1929

937

48,57

161

8,35

85

4,41

185

9,59

442

22,91

119

 

6,17

2010

2381

1058

44,44

237

9,95

196

8,23

249

10,46

545

22,89

96

 

4,03

2011

1155

585

50,65

72

6,23

51

4,42

84

7,27

325

28,14

38

 

3,29

2012

1751

1028

58,71

89

5,08

52

2,97

88

5,03

466

26,61

28

 

1,60

2013

2394

1167

48,75

163

6,81

132

5,51

174

7,27

591

24,69

167

 

6,97

2014

2375

1209

50,91

133

5,60

105

4,42

142

5,98

579

24,38

207

 

8,71

2015

2451

1359

55,45

145

5,92

102

4,16

163

6,65

536

21,87

146

 

5,95

Ито

20323

9862

48,53

1399

6,88

1025

5,04

1624

7,99

507

24,97

133

 

6,59

го

 

 

 

 

 

 

 

 

 

5

 

8

 

 

Рис. 5. Распределение причин пожаров во Вьетнаме (2006-2015 гг.): 1- неосторожное обращение с огнѐм; 2 - нарушение правил пожарной безопасности; 3 - стихийные бедствия;

4 - умышленные поджоги; 5 - техногенные причины; 6 -иные причины

Литература

1.Закон о предотвращении пожаров и противопожарной безопасности СРВ. - Ханой: Национальное политическое издательство, 2013. - 22 с.

2.Статистика Главного управления пожарной охраны и аварийно-спасательных служб Вьетнама за 2001-2015 гг.

1Академия Государственной противопожарной службы МЧС России.

2Главное управление ПАСС Вьетнама.

3Институт пожарной Безопасности Вьетнма.

42

Dao Anh Tuan

ANALYSIS OF FIRE INCIDENTS IN VIETNAM

The article considers the analysis of fire incidents in Vietnam in period 2001-2015

Keywords: fire incident, damages, Vietnam

1The State Fire Academy of Emercom of Russia

2Vietnam fire and rescue police department

3The University of fire fighting and prevention of Viet Nam

УДК 502.5; 504.05; 556; 625.04

С.В. Журихин

СРАВНЕНИЕ МЕТОДИК РАСЧЕТА МАКСИМАЛЬНЫХ ДОЖДЕВЫХ РАСХОДОВ ВОДЫ С МАЛЫХ ВОДОСБОРОВ ПРИ ОТСУТСТВИИ ДАННЫХ НАБЛЮДЕНИЙ

ДЛЯ ПРОЕКТИРОВАНИЯ ВОДООТВОДНЫХ СООРУЖЕНИЙ

В статье рассмотрены основные виды водоотводных сооружений, применяемые в дорожном строительстве, а также проанализированы методики расчета максимальных дождевых расходов воды, применяемые в настоящее время

Ключевые слова: защита от воздействия поверхностного стока, водоотводные сооружения, максимальные дождевые расходы воды, нормативные методики расчета поверхностного стока

Значение и виды водоотводных сооружений для отвода поверхностных вод на железных дорогах.

Водоотводные сооружения это комплекс сооружений, служащих для отвода от земляного полотна или с площадки поверхностных и грунтовых вод. Поверхностные воды отводятся от насыпей резервами и канавами, устраиваемыми с нагорной стороны, а от выемок — кюветами, нагорными и забанкетными канавами; грунтовые воды — разного рода дренажными устройствами.

Путевой резерв – водоотвод вдоль насыпи, образованный планировкой карьера, из которого был взят грунт для ее отсыпки, назначением которого является перехват и отвод воду, текущей к телу насыпи. Путевой резерв устраивают с двух сторон насыпи при поперечном уклоне местности меньше 1:10 или с одной нагорной стороны при уклонах от 1:10 до 1:5. Размеры путевого резерва определяют в зависимости от объема потребного грунта, параметров применяемых машин и механизмов, уклона стока и условий охраны окружающей среды. Расстояние между внешней бровкой резерва и границей полосы отвода должно быть не менее 1 м.

Водоотводная канава — сооружение в грунте, предназначенное для защиты земляного полотна (чаще насыпей) от размыва или переувлажнения, сбора поверхностных (иногда и грунтовых) вод и отвода их в ближайший водоток. Водоотводные канавы проектируют на основании гидравлические расчѐтов, используя типовые конструкции. В необходимых случаях дно водоотводной канавы защищают от размыва слоем щебня, мощением, сборными (монолитными) плитами или железобетонными конструкциями; откосы — посевом трав, плитами (реже дѐрном, мощением).

Кювет – канава в выемке между ее откосом и железнодорожным полотном для отвода поверхностных вод с полотна и откосов выемки и осушения полотна на небольшую глубину. Дно кювета, укрепляемое, как и его откосы, сплошной одерновкой, должно иметь уклон, соответствующий уклону пути. У выходов выемки кюветы отклоняются в сторону от полотна или отводятся в резерв [4].

В проекты земляного полотна необходимо включать постоянные и временные (на период строительства) устройства для отвода поверхностных вод.

43

Отвод поверхностных вод в пониженные места рельефа и к водопропускным сооружениям следует предусматривать: от насыпей и полунасыпей - канавы (нагорными, продольными и поперечными водоотводными) или резервами; от откосов выемок и полувыемок - канавами (нагорными и забанкетными); от основной площадки земляного полотна в выемках и полувыемках - с помощью кюветов или лотков [5].

Основными документами в области проектирования водоотвода на железных дорогах являются: СП 32-104-98 «Проектирование земляного полотна железных дорог колеи 1520 мм», СП 119.13330.2012 «Железные дороги колеи 1520 мм. Актуализированная редакция СНиП 32-01-95», Пособие по проектированию земляного полотна и водоотвода железных и автомобильных дорог промышленных предприятий (к СНиП 2.05.07-85), Пособие по гидравлическим расчетам малых водопропускных сооружений.

Всостав работ по проектированию водоотводных устройств входят: определение объема стока к водоотводным устройствам водосборного бассейна; выбор вида, размеров и местоположения водоотводного устройства, позволяющих применять землеройные машины для его сооружения, а также для очистки в период эксплуатации; назначение продольного уклона и скорости течения воды, исключающих возможность заиливания или размыва русла при принятом типе укрепления откосов и дна.

Расчетные расходы воды вероятностью превышения: на линиях скоростных, особогрузонапряженных, категорий I и II - 1:300 (0,33%), на линиях категорий III и IV - 1:100 (1%), а продольных канав у насыпей и поперечных водоотводных канав - 1:33 (3%) с укреплением выпусков от возможности оврагообразования.

Бровка канавы должна возвышаться не менее чем на 0,2 м над уровнем воды, соответствующим расходу указанной вероятности превышения. Глубина водоотводных и нагорных канав и ширина их по дну должны быть не менее 0,6 м, на болотах - не менее 0,8 м.

Расчетные сечения канав, кюветов и лотков назначаются в точках переломов продольного уклона дна канав, а на участках с однородным уклоном - в точках резкого изменения расчетного расхода воды, но не реже чем через 200 м [5].

Основные регламентированные методики для расчета максимальных дождевых расходов воды.

Внормативных документах по проектированию водоотвода СП 32-104-98 «Проектирование земляного полотна железных дорог колеи 1520 мм», СП 119.13330.2012 «Железные дороги колеи 1520 мм. Актуализированная редакция СНиП 32-01-95» расчетные расходы воды на участках водоотвода рекомендуется рассчитывать с помощью методик приведенных в СП 33-101-2003. Методы для расчета стока в данном нормативном документе делятся на три основных типа: при наличии данных гидрометеорологических наблюдений, при недостаточности данных наблюдений, при отсутствии данных наблюдений.

Сбор воды водоотводными сооружениями на железной дороге, как правило, осуществляется с небольших водосборов, не имеющих данных наблюдений. Поэтому возможно применение методов только третьего типа (при отсутствии данных гидрометеорологических наблюдений).

При отсутствии гидрометрических наблюдений расчетные значения максимальных расходов воды дождевых паводков с водосборов площадью менее 200 км2 по формуле предельной интенсивности [6].

Следует учитывать то, что расчетные методы, приведенные в СП 33-101-2003 применимы только для бассейнов находящихся в естественных условиях. Зачастую, к насыпи железной дороги примыкают техногенно-образованные участки местности, а также участки, испытывающие различные внешние нагрузки. Характеристики описанных выше водосборов не учтены параметрами формул приведенных в данном СП, а аналогов таких водосборов с рядами наблюдений практически не существует.

Таким образом, в практику гидрологических расчетов подтверждает и обуславливает необходимость проведения полевых исследований водотоков, а также разработки методов

44

их проведения и обобщения результатов этих исследований. А поскольку методы полевых гидрологических исследований и расчетов на их основе максимальных расходов также не регламентированы и не ограничены СП 33-101-2003, то они должны устанавливаться проектно-изыскательской организацией.

Для строительства водоотводных сооружений применение СП 33-101-2003 ограничивается не только размерами водосборов и физико-географическими зонами, но и отсутствием рекомендаций: 1) по определению объема паводочного стока; 2) по приближенным методам расчетов максимального стока на ускоренных изысканиях для технико-экономических обоснований (ТЭО); 3) по определению максимального стока на различных стадиях проектно-изыскательских работ; 4) по оценке предельных максимумов стока; 5) по учету региональных особенностей искусственного и естественного регулирования максимального стока; 6) по оценке максимальных расходов в особых условиях формирования паводочного стока; 7) по расчету и регулированию максимального стока с микробассейнов дорожного водоотвода, характеризующихся безрусловыми односклоновыми прямоугольными поверхностями с различными типами искусственных покрытий и сочетанием поперечных и продольных уклонов стекания; 8) по расчету максимального стока при отсутствии подробного топографического материала.

Отсутствие в СП 33-101-2003 рекомендаций по этим вопросам, а также методов полевых гидрологических исследований максимального стока и обобщений полученных результатов обуславливает необходимость и правомерность их разработки и регламентирования ведомственными инструктивно-нормативными документами для различных отраслей строительства с учетом их специфики и задач развития.

Наряду, с формулой предельной интенсивности рекомендованной СП 33-101-2003, популярность получила методика Союздорпроекта, разработанная Б.Ф. Перевозниковым 1970-1980 годах основанная на линейно-региональных нормах максимального стока. Данная методика широко используется в дорожном проектировании и прописана почти во всех методических рекомендациях для расчета максимального дождевого стока, а также в ПМП-91 и пособии по гидравлическому расчету малых водопропускных сооружений [1].

Основу данной методики составляет разделение территории России на ливневые районы с различной интенсивностью осадков, а также учет влияния размеров, формы и крутизны водосбора на величину стока.

Достоинством данной методики можно назвать, то, что ее можно применять для всей территории России. Неоднократное использование на территории приграничных государств и других стран мира. Возможность применения различных коэффициентов по учету региональных особенностей искусственного и естественного регулирования максимального стока, по оценке максимальных расходов в особых условиях формирования паводочного стока, по расчету и регулированию максимального стока с микробассейнов дорожного водоотвода, характеризующихся безрусловыми односклоновыми прямоугольными поверхностями с различными типами искусственных покрытий и сочетанием поперечных и продольных уклонов стекания, по расчету максимального стока при отсутствии подробного топографического материала [1, 2].

Недостатками данного метода являются то, что данные необходимые для расчетов по этой методике не обновлялись с 80х годов.

СП 32.13330.2012 «Канализация. Наружные сети и сооружения». Актуализированная редакция СНиП 2.04.03-85 для расчета дождевых вод рекомендуется формула предельных интенсивностей использующая параметры продолжительности и интенсивности дождя и коэффициент учитывающий поверхность стокообразующих площадей. Дают заниженные результаты при расчетах максимальных расходов редкой повторяемости.

ВСН 63-76 «Инструкция по расчету ливневого стока воды с малых бассейнов» приводится методика расчета единичного паводка, но в связи с трудоемким процессом выполнения расчета по номограммам, рекомендации уточнения расходов по натурным данным и силь-

45

ным завышением расчетных максимальных расходов воды она практически не используется. Выводы.

Отсутствие правильно спроектированных водоотводных сооружений, несвоевременность их постройки или плохое содержании в период эксплуатации, приводят к тому, что поверхностные воды могут причинить большой вред: размыв земляного полотна, насыщение его водой, подтопление полосы отвода, что может послужить причиной перерыва движения.

Насыщение грунта земляного полотна водой выше известного предела снижает несущую способность основной площадки его, в результате чего появляются просадки, выплески и пр., а при пучинистых грунтах образование пучин.

Во избежание указанных отрицательных явлений на всех вновь сооружаемых и реконструируемых дорогах должен быть обеспечен своевременный и надѐжный отвод воды с поверхности земляного полотна, участков склонов, выемок, полосы отвода.

Одним из важнейших факторов проектирования водоотводных устройств является правильный расчет расходов стока поверхностных вод. При проектирования дорожного водоотвода выделяют два основных слагающих участка водосбора – это верховая сторона (естественный или техногенно-образованный склон, подходящий к водоотводному сооружению) и откосы насыпи (имеющие уклоны, как правило, более 300 промилле и круче, что не характерно для естественных условий).

Для подсчета стока со склона естественного происхождения, можно руководствоваться любой регламентированной методикой. Но при крутых уклонах, наличии терассирования склонов, искусственного покрытия или застройки – использование формулы предельной интенсивности ограничено.

Врезультате анализа вышеперечисленных методик на малых техногеннонагруженных водосборах было выявлено следующее:

Наименьшие значения максимальных расходов воды обеспеченностью 0,33%, 1%, 2%, 3%,5% были получены при использовании методик приведенных в СП 32.13330.2012 и СП

33-101-2003.

Значения максимальных расходов воды обеспеченностью 0,33%, 1%, 2%, 3%,5% по методике Союздорпроекта превышают значения, полученные по формуле предельной интенсивности, 1,5-2 раза, а расходы, рассчитанные по ВСН 63-76, превышают в 2-4 раза значения, полученные по формуле предельной интенсивности.

При изменении обеспеченности расчетных максимальных расходов воды от 5% до 10% разница в значениях, полученных по различным методикам, сокращается.

При обеспеченности максимального расходы воды – 10%, значения, полученные по перечисленным методикам, практически одинаковы;

На основе проделанной работы можно рекомендовать к использованию методику Союздорпроекта разработанная Б.Ф. Перевозниковым, наиболее подходящую для расчета максимальных дождевых расходов воды для проектирования дорожного водоотвода, так как довольно проста в использовании, имеет возможность дополнения данных по расчетной интенсивности осадков, применима для поверхностей с разнообразными уклонами и дает запас прочности для расчетных значений расхода воды.

Внастоящее время связи с развитием и реконструкцией сети железных и автомобильных дорог, изменением климатических условий с увеличение выпадения жидких осадков, ужесточением норм проектирования и строительства, действующая нормативная и методическая база по расчету поверхностного стока, не обеспечивает современных требований надежности для сооружений водоотвода. Вопросы типового и индивидуального проектирования нуждаются в углубленном изучении и обобщении накопленного отечественного и зарубежного опыта за прошедшие годы. Необходимо обновление существующих методик расчета с учетом повсеместного распространения техногенно-измененных ландшафтов. Кроме того, следует подчеркнуть важность проведения дополнительных научных исследований, которые, являются неотъемлемой частью решения проблем проектирования водоотводных со-

46

оружений.

Литература

1.Методические рекомендации по расчету максимального дождевого стока и его регулированию / Союздорпроект. – М.:Союздорпроект, 1980. – 141 с

2.Методические указания по инженерно-гидрометеорологическим изысканиям автомобильных дорог / Союздорпроект. – М.: Союздорпроект, 1974. – 278 с.

3.Пособие к СНиП 2.05.03-84 «Мосты и Трубы» по изысканиям и проектированию железнодорожных и автодорожных мостовых переходов через водотоки (ПМП-91) / Трансстрой. – М.: ПКТИтрансстрой, 1992. – 411 с.

4.Пособие по гидравлическим расчетам малых водопропускных сооружений / ВНИИ транспортного строительства (ЦНИИС), Главное управление проектирования и капитального строительства (ГУПиКС) Минтрансстроя СССР. – М.: Транспорт, 1992. – 408 с.

5.Пособие по проектированию земляного полотна и водоотвода железных и автомобильных дорог промышленных предприятий (к СНиП 2.05.07-85) / Всесоюзный проектный и научно-исследовательский институт промышленного транспорта (ПРОМТРАНСНИИПРОЕКТ) Госстроя СССР. – М.: Стройиздат, 1988. – 145 с.

6.СП 33-101-2003. Определение основных расчетных гидрологических характеристик

/Госстрой. – М.:Госстрой России, 2004. – 74 с.

ФГБОУ ВО «Воронежский государственный университет»

S.V. Zhurikhin

THE COMPARISON OF METHODS OF CALCULATING MAXIMUM RAINFALL DISCHARGE FROM SMALL CATCHMENTS IN THE ABSENCE OF OBSERVATION DATA FOR DESIGNING DRAINAGE CONSTRUCTIONS.

The paper consideration the main types of drainage constructions used in road construction, and also analyze the methods for calculating the maximum rainwater discharge currently used

Key words: protection from the impact of surface runoff, drainage constractions, maximum rainwater discharge, normative methods for calculating surface runoff

Federal State Budgetary Educational Institution of Higher Education «The Voronezh State University»

УДК 57.087.1

В.Р. Закирова1, Д.А. Сырокваш1, С.В. Гилевский1, Н.Н. Яцков1, П.В. Назаров2

РАЗРАБОТКА АЛГОРИТМОВ И ПРОГРАММНЫХ СРЕДСТВ КЛАССИФИКАЦИИ НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

В работе проведено исследование кодирующих и некодирующих нуклеотидных последовательностей генома человека. Разработаны семь моделей векторизации нуклеотидных последовательностей. Наилучшая модель включает 108 признаков. Определены 27 наиболее информативных признаков. Ошибка классификации кодирующих и некодирующих последовательностей с использованием метода ―случайного леса‖ менее 1%.

Ключевые слова: биоинформатика, ДНК, экзон, интрон, классификация, метод "случайного леса", машина опорных векторов, отбор признаков, программирование на языке R

Введение.

Появление новых технологий секвенирования иинструментов для точечного манипулирования структурой ДНК позволяет на генетическом уровне подавлять болезни, повышать устойчивость организмов к неблагоприятным условиям среды и продлевать продолжительность их жизни [7]. В данном контексте, определение предназначения генов и ихкодирую-

47

щих и некодирующихучастков, экзонов и интронов,является важной задачей.

Основным этапом анализа нуклеотидных последовательностей является формирование векторов признаков для экзонов и интронов молекул ДНК [4].

Большинство существующих моделей векторизации нуклеотидных последовательностей имеют ограничения, что приводит к увеличению ошибки классификации кодирующих и некодирующих нуклеотидных последовательностей генома человека [1]. Перспективным направлением повышения производительности и точностиклассификации нуклеотидных последовательностей являетсяотбор наиболее информативных признаков нуклеотидных последовательностей.

Целью исследования является разработка статистического подхода и программного пакета для классификации кодирующих и некодирующих нуклеотидных последовательностей геномных данных.

Разработка алгоритмов и программных средств. Модели формирования вектора признаков.

Вработе исследован ряд моделей формирования вектора признаков нуклеотидных последовательностей, а именно:

- частотная модель с использованием частот нуклеотидов и биграммов – модель 1; - частотная модель с использованием частот триграммов – модель 2;

- модель CPF (Category-Position-Frequency) [4] – модель 3;

- модификация модели CPF с уменьшенным числом компонент – модель 4; - модель на основе общих статистических признаков [6] – модель 5;

- две модели на основе статистических признаков экзонов и интронов – модели 6 и 7. Частотные модели рассматриваются как эталонные: с использованием частот нуклео-

тидов и биграммов (20 признаков) и частот триграммов (64 признака). Реализованы две модели CPF с 12 и 8 признаками.

Вмоделях на основе статистических признаков в качестве общих признаков нуклеотидных последовательностей выбраны [6]:длина последовательности;частоты нуклеотидов A, T, G, C;частоты биграммов AT и GC;корреляционные факторы нуклеотидов.В качестве специальных признаков выбраны признаки [1]:логарифм длины последовательности;частоты биграммов TA и CG;частоты триграммов AAA и TTT;флаги начала последовательности три-

граммов CTA, CTG, GTA, GTG.

Дополнительно рассмотрена модель, включающая вышеописанные признаки моделей,

атакже флаги начала последовательности биграммов CT и GT.

Программная реализация алгоритмов анализа данных.

Алгоритмы анализа данных реализованы на языке программирования R [9]. В работе использовались стандартные алгоритмы классификации данных, такие как методы "случайного леса" (пакет randomForest)и опорных векторов (пакет e1071), алгоритмы автоматического отбора признаков (пакеты caret и sbf).

Алгоритм анализа данных.

Процесс анализа экспериментальных данных разделѐн на два этапа.

На первом этапе проводится исследование моделей векторизации с двумя типами классификаторов:

Метод "случайного леса" из пакета randomForest;

Метод опорных векторов с радиальной базисной функцией в качестве ядра из пакета

e1071.

Главными задачами первого этапа являются выбор оптимального классификатора для дальнейшей работы, а также оценка значимости признаков моделей. По результатам первого этапа выбран оптимальный классификатор и набор из 20-30 наиболее информативных признаков. Размеры обучающей и тестируемой выборки составляют 1000 и 10.000 последовательностей соответственно.На втором этапе определяется точность классификации в зависимости от количества информативных признаков.

48

Результаты.

Определение оптимального набора признаков.

Результаты классификации экзонов и интронов для семи моделей векторизации, полученные в ходе первого этапа анализа данных, представлены в табл. 1.

Таблица 1

Ошибка классификации (%)

Модель

"Случайный лес"

Машина опорных векторов

 

 

 

1

18,94

16,32

 

 

 

2

14,60

11,35

 

 

 

3

17,03

15,24

 

 

 

4

17,11

15,29

 

 

 

5

15,55

18,56

 

 

 

6

10,89

9,70

 

 

 

7

8,10

8,38

 

 

 

Методы "случайного леса" и опорных векторов демонстрируют сопоставимую точность. Для дальнейшего исследования выбран метод "случайного леса".

Дополнительное исследование значимости отдельных признаков моделей векторизации проведено на основе коэффициента расщепления Джини метода "случайного леса". В результате исходный набор из 108 признаков сократился до 27.

Оценка эффективности наборов признаков.

На втором этапе проведена оценка эффективности групп признаков размером 4, 6, 8, 10, 12, 14, 17, 20, 23 и 27. Исследование выполнено с помощью пятикратной перекрестной проверки. Размеры обучающей и тестовой выборок 1000 и 100000 последовательностей соответственно.Дополнительно, набор 27 признаковранжирован на основе коэффициента расщепления Джини метода "случайного леса". Результаты представлены на рисунке.

Зависимость ошибки классификации ER от количества признаков

49

Результаты ранжирования 23 лучших признаков приведены в табл. 2.

Таблица 2

Ранжированный список признаков

 

 

Коэффициент

 

 

Коэффициент

Признак

расщепления

Признак

расщепления

 

 

Джини

 

 

Джини

1

Длина

8574,5

13

isGTG

1151,2

 

 

 

 

 

 

2

Log(длины)

8274,2

14

θTG

1141,3

3

isGT

4317,6

15

FCGT

1052,4

4

isCT

3658,2

16

FTG

1048,5

5

FTCG

2082,9

17

FTA

1043,6

6

FTAG

2073,8

18

FTC

1040

7

isCTG

2073

19

FGTA

962,9

8

θGC

1802,7

20

θAG

794,9

9

isGTA

1782

21

FCA

794,4

10

FCCC

1761,1

22

θTC

729,1

11

FCG

1422,6

23

θAT

652,6

 

 

 

 

 

 

12

θAC

1340,5

 

 

 

 

 

 

 

 

 

Ошибка классификации составляет менее 1% для 100 000 экзонных и интронных последовательностей. Таким образом, кодирующие и некодирующие последовательности действительно различаются.

Выводы.

В работе проведено исследование экзонных и интронных последовательностей генома человека. Разработаны семь моделей векторизации нуклеотидных последовательностей. Наилучшая модель включает 108 признаков. Определены 27 наиболее информативных признаков. Ошибка классификации экзонных и интронных последовательностей менее 1%. Подтверждено различие кодирующих и некодирующих нуклеотидных последовательностей.

Литература

1.Разработка алгоритмов и автоматизированных программных средств для классификации кодирующих и некодирующих нуклеотидных последовательностей / Д.А. Сырокваш и др. − Международный конгресс по информатике: информационные системы и технологии, Республика Беларусь, Минск, 24. – Минск, 2016 г. – с. 189 – 193.

2.Advancing Feature Selection Research / Zheng Zhao [et. al.] − ASU Feature Selection Repository. – 2010. – P. 1 – 28.

3.Application of high-dimensional feature selection: evaluation for genomic prediction in man / Bermingham, M.L. [et al.] − Sci. Rep. 5, 10312; doi: 10.1038/srep10312. −2015.

4.Baoetal. An improved alignment-free model for DNA sequence similarity metric / JunpengBao, Ruiyu Yuan, ZheBao. − DMC Bioinformatics 2014, 15:312.

5.Bellman R.E. Dynamic Programming / R.E. Bellman. − CourierDoverPublications. – 2003. – 384p.

6.Comparative Analyses between Retained Introns and Constitutively Spliced Introns in Arabidopsos thaliana Using Random Forest and Support Vector Machine / Rui Mao [et. al.] − PLoSOne. – 2014. – Vol.9 №8. – pp. 1-12.

7.Edwards D.J., Holt K.E. Beginner's guide to comparative bacterial genome analysis using next-generation sequence data / D.J. Edwards, K.E. Holt. − MicrobialInformaticsandExperimenta-

50