- •Опыт построения математической модели синдрома цитолиза при инфекционном мононуклеозе у детей
- •Определение распространенности изучаемых синдромов.
- •Метод нейронных сетей.
- •Метод построения дерева решений.
- •Метод ассоциативных правил.
- •Опыт построения математической модели регионарной лимфаденопатии у детей дошкольного возраста.
Метод нейронных сетей.
Для поиска закономерностей в большом массиве данных, а также для решения задач описательной статистики нами были использованы самоорганизующиеся карты (карты Кохонена).
Исходное множество данных (значения исследуемых признаков по каждому наблюдению) было распределено на два подмножества для последующего построения самоорганизующихся карт Кохонена, основанных на алгоритме кластеризации по методу ближайших соседей. При этом 95% исходного массива записей случайным образом было отобрано для обучающей выборки, а 5% - для тестовой.
Условием остановки процесса обучения самоорганизующейся карты являлось выполнение условия – в тестовом и обучающем множествах ошибка принимала значения меньше 0,05. Начальная инициализация карты Кохонена производилась из обучающего множества. Количество кластеров определялось автоматически при 1% уровне значимости. Автоматически вся выборка была разбита на 5 кластеров. На рис.5 приведена структура двух, самых больших кластеров (50% всей выборки).
Рис.5 Профили кластеров.
Распространенность изучаемых синдромов составляет:
- в кластере «0» (30% всей выборки):
синдром цитолиза – 99%, серопозитивность (М) к ВЭБ – 99%, лейкоцитоз – 99%, ангина – 2%, гепатоспленомегалия – 48%, атипичные мононуклеары- 19,6%, серопозитивность (М) к ЦМВ – 7,7%, лимфаденит – 79,8%;
- в кластере 1 (22% всей выборки):
синдром цитолиза – 100%, серопозитивность (М) к ВЭБ – 99%, лейкоцитоз – 44,6%, ангина – 43,8%, гепатоспленомегалия – 82%, атипичные мононуклеары- 60%, серопозитивность (М) к ЦМВ – 80,7%, лимфаденит – 36,3%.
Результаты работы алгоритма самоорганизующихся карт отображаются на девяти картах. Каждому входному полю соответствует своя карта.
Рис. 6. Матрица карт Кохонена.
Анализ полученных карт Кохонена позволяет сформулировать следующие выводы:
1. У всех больных с синдромом цитолиза, определялись такие клинико-лабораторные симптомы как лимфаденит и гепатоспленомегалия.
2. У большинства больных с синдромом цитолиза определялась ангина и лейкоцитоз периферической крови.
.
Метод построения дерева решений.
Для решения задачи распознавания прогностической значимости в развитии синдрома цитолиза избранных клинико-лабораторных критериев, была построена математическая модель в форме дерева решений. Оно позволяет в доступной и наглядной форме представлять правило в форме «если… то…», что способствует оптимизации процесса работы врача.
Для оценки значимости показателя использован коэффициент значимости в %, лежащий в диапазоне от 0 до 100. Чем выше значение данного коэффициента, тем более значим показатель. При построении деревьев решений для отсечения незначимых показателей использовано пороговое значение 20 %.
На основании проведенного эксперимента построено дерево решений для синдрома цитолиза (рис 7.) Точность моделирования составила 61 %.
Рис. 7. Дерево решений (выходное значение – синдром цитолизаtrue).
Далее на основании полученного дерева решений были разработаны правила для синдрома цитолиза при инфекционном мононуклеозе у детей. Для выходного значения исследуемой переменной (синдром цитолиза положительный- true), получено одно правило, которое гласит :«если имеется синдром гепатоспленомегалии и ангины, то цитолиз вероятен с достоверностью 54%».
.
Рис. 8. Правило для синдрома цитолиза у детей.
Дерево решений позволяет автоматически определять значимость входных переменных, для чего предназначен визуализатор Значимость атрибутов. Так, мы видим, что наибольшую значимость для прогнозирования развития синдрома цитолиза при инфекционном мононуклеозе у детей имеет синдром гепатоспленомегалии – 59 % значимости (рис.9).
Рис.9. Значимость атрибутов для синдрома цитолиза.
