Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УИР / УИР.docx
Скачиваний:
26
Добавлен:
11.06.2015
Размер:
128.38 Кб
Скачать

Министерство образования и науки Российской Федерации

ОБНИНСКИЙ ИНСТИТУТ АТОМНОЙ ЭНЕРГЕТИКИ - филиал

Федерального государственного автономного образовательного учреждения высшего профессионального образования

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЯДЕРНЫЙ УНИВЕРСИТЕТ «МИФИ»»

(ИАТЭ НИЯУ МИФИ)

Кафедра автоматизированных систем управления

УДК ДОПУЩЕНА К ЗАЩИТЕ

Заведующий кафедрой АСУ

д.т.н., профессор

_________________ А.Н. Анохин

Выпускная работа

ТЕМА РАБОТЫ

Студент гр. ИНФ-Б10 ____________________ С.В. Карпенко

Руководитель ____________________ В.И. Тищенко

Рецензент ____________________ В.В. Кащеев

Обнинск 2014

Объектом исследования являются аналитические методы обработки радиационно-эпидемиологических данных.

Цель работы – разработка алгоритма подготовки и первичного дескриптивного анализа агрегированных радиационно-эпидемиологических данных.

В данной работе исследуется индивидуальная медико-дозиметрическая информация о лицах подвергшихся радиационному облучению в результате радиационных катастроф.

Проводится обработка статистической информации, накопленной радиационно-эпидемиологическими лабораториями за годы исследований в этой сфера. Накопленная информация будет определенным образом структурирована для выявления определенных закономерностей в развитии тех или иных форм раковых заболеваний.

Оглавление

Глава 1. Изучение основных современных методов анализа эпидемиологических данных («Datamining»). 5

1. Понятие Статистики 6

2. Понятие Машинного обучения 6

3. Понятие Искусственного интеллекта 6

4. Сравнение статистики, машинного обучения и Data Mining 7

5. Развитие технологии баз данных 8

6. Понятие Data Mining 9

7. Отличия Data Mining от других методов анализа данных 12

Глава 2. Эпидемиологические исследования. 14

1. Когортные исследования. 14

2. Исследования по методу случай-контроль (case-control method). 20

Последовательность исследования по методу случай-контроль. 21

Введение.

"За последние годы, когда, стремясь к повышению эффективности и прибыльности бизнеса, при создании БД все стали пользоваться средствами обработки цифровой информации, появился и побочный продукт этой активности - горы собранных данных: И вот все больше распространяется идея о том, что эти горы полны золота".

В прошлом процесс добычи золота в горной промышленности состоял из выбора участка земли и дальнейшего ее просеивания большое количество раз. Иногда искатель находил несколько ценных самородков или мог натолкнуться на золотоносную жилу, но в большинстве случаев он вообще ничего не находил и шел дальше к другому многообещающему месту или же вовсе бросал добывать золото, считая это занятие напрасной тратой времени.

Сегодня появились новые научные методы и специализированные инструменты, сделавшие горную промышленность намного более точной и производительной. Data Mining для данных развилась почти таким же способом. Старые методы, применявшиеся математиками и статистиками, отнимали много времени, чтобы в результате получить конструктивную и полезную информацию.

Сегодня на рынке представлено множество инструментов, включающих различные методы, которые делают Data Mining прибыльным делом, все более доступным для большинства компаний.

Термин Data Mining получил свое название из двух понятий: поиска ценной информации в большой базе данных (data) и добычи горной руды (mining). Оба процесса требуют или просеивания огромного количества сырого материала, или разумного исследования и поиска искомых ценностей.

Глава 1. Изучение основных современных методов анализа эпидемиологических данных («Datamining»).

Понятие Data Mining, появившееся в 1978 году, приобрело высокую популярность в современной трактовке примерно с первой половины 1990-х годов. До этого времени обработка и анализ данных осуществлялся в рамках прикладной статистики, при этом в основном решались задачи обработки небольших баз данных.

О популярности Data Mining говорит и тот факт, что результат поиска термина "Data Mining" в поисковой системе Google (на сентябрь 2005 года) - более 18 миллионов страниц.

Data Mining - мультидисциплинарная область, возникшая и развивающаяся на базе таких наук как прикладная статистика, распознавание образов, искусственный интеллект, теория баз данных и др., см. рис. 1.

Рис. 1. Data Mining как мультидисциплинарная область.

Приведем краткое описание некоторых дисциплин, на стыке которых появилась технология Data Mining.

Соседние файлы в папке УИР