Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИИТ в медицине [Н.Ф.Рожков][2004].doc
Скачиваний:
120
Добавлен:
15.06.2014
Размер:
967.17 Кб
Скачать

5.3 Программные средства анализа данных

Важное значение имеет также программное средство (статистический пакет), которое используется при компьютерном анализе. Поскольку освоение пакета является, пожалуй, самым трудоемким этапом современной технологии обработки и анализа данных, обычно осваивается только один пакет и надолго.

Для обработки данных и, в частности, медицинских обычно используют два типа программных средств. Это пакеты обработки данных и электронные таблицы.

Пакеты обработки данных. Число пакетов для обработки данных, получивших распространение в России, достигает нескольких десятков. Из зарубежных пакетов это SYSTAT, STATGRAPHICS, ВМDР, SPSS, SAS, CSS, Statistiсa и др. Из отечественных — можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, САНИ, КЛАСС-МАСТЕР СИГАМД (DataScope) и др. (Таблица 5.2).

Таблица 5.2 – Классификация статистических пакетов

Типы

Отечественные

Зарубежные

Стоимость, $

Профессиональные

Нет

SAS, BMDP

2000 – 10000

Универсальные

STADIA, Olimp

Statgraphics, SPSS, S-PLUS, STATISTICA

500 – 5000

Специализированные

Mesosaur, DataScope, Класс-Мастер, Эвриста, САНИ

Большое количество

200 - 1500

Основную часть имеющихся пакетов для обработки данных можно отнести к трем категориям: специализированные пакеты, пакеты общего назначения и профессиональные пакеты.

Специализированные пакеты обычно содержат методы из одного- двух разделов статистики или методы, используемые в конкретной предметной области.

Пакеты общего назначения или универсальные. Благодаря отcутcтвию ориентации на специфическую предметную область, широкому диапазону статистических методов, дружелюбному интерфейсу пользователя они являются наиболее удобными для начинающего пользователя. При этом хотя в обработке медицинских данных и присутствуют специфические особенности, практически все медицинские задачи могут быть решены с помощью универсальных пакетов.

Профессиональные пакеты предназначены для пользователей имеющих дело со сверхбольшими объемами данных или узкоспециализированными методами анализа.

Кратко рассмотрим основные пакеты обработки данных.

Пакеты STATGRAPHICS, STADIA, SYSTAT, SPSS, Statistiсa, являются универсальными пакетами, содержащими большинство стандартных статистических методов. Пакеты SYSTAT, SPSS переведены на персональные компьютеры с больших ЭВМ, предыдущих поколений, поэтому, наряду с представительным набором тщательно реализованных вычислительных методов, они сохраняют некоторые архаические элементы. Пакеты Statistiсa, STADIA, STATGRAPHICS исходно разработаны для ПЭВМ, а поэтому проще в обращении. Эти пакеты содержат, вероятно, наибольшее количество методов статистического анализа.

Пакеты ЭВРИСТА и МЕЗОЗАВР являются специализированными пакетами, предназначенными для анализа временных рядов и регрессионного анализа.

Пакет КЛАСС-МАСТЕР предназначен для кластерного анализа данных.

Пакет САНИ предназначен для анализа и визуализации разнотипных данных, в основном, нечисловой природы.

Отдельную группу специализированных пакетов составляют пакеты, предназначенные для решения задач медицинской статистики. Примером таких программных средств являются пакеты Ерi info, РЕРI, 1 Вауегs, служащие для статистической обработки эпидемиологических данных.

Практически все статистические пакеты обеспечивают широкий набор средств визуализации данных: построение графиков, двух- и трехмерных диаграмм, а часто и различные средства деловой графики.

Для обработки медико-биологической информации обычно используют универсальные пакеты программ обработки данных, такие как STATGRAPHICS, STADIA, SYSTAT, SPSS, Statistiсa и другие.

Электронные таблицы или табличные процессоры менее удобны для анализа медицинских данных. Тем не менее, простейшая статистическая обработка данных в диссертационных работах час то проводится именно с помощью электронных таблиц вследствие их широкой распространенности.

Электронные таблицы предназначены, в основном, для организации относительно несложных расчетов с большим количеством идентичных данных, например, бухгалтерских расчетов.

Все распространенные электронные таблицы позволяют вычислять значения элементов таблиц по заданным формулам, строить по данным в таблице различные графики и т. д. Многие из них предоставляют и дополнительные возможности. Некоторые из них расширяют возможности по обработке данных — трехмерные таблицы, связь с базами данных и т.д.

Наиболее популярные электронные таблицы Suprecalc, Quatro PRO, Lotus 1-2-3, Ехсеl и другие по мере развития стали оснащаться средствами статистической обработки данных. И, хотя даже самые мощные из них (Ехсеl) существенно уступают специализированным па кетам обработки данных, тем не менее, в такие пакеты включены наиболее часто используемые статистические процедуры: средства описательной статистики, методы регрессионного анализа, средства анализа временных рядов, сглаживания и прогнозирования.

Сравнительные характеристики основных пакетов для обработки и анализа данных. Рассмотрим подробнее сравнительные характеристики наиболее распространенных пакетов, используемых для обработки и анализа данных: STATGRAPHICS, SPSS, Statistiсa и Ехсеl. Все эти пакеты работают в среде Windows однако имеют определенные отличия.

Таблица 5.3 – Сравнительные характеристики основных статистических пакетов

Характеристика

Statgraphics Plus

SPSS

Statistica

Excel

Фирма

Manugistics

SPSS

StatSoft

Microsoft

Версия

2,2

7,0

5,0

2000

Год разработки

1996

1995

1995

1999

Год 1 версии

1983

1975

1990

Объем пакета МБ

14,5

26,3

16,3

Доступность

4

3

2

1

Русифицированность

-

-

-/+

+

Число процедур

>250

>250

>250

19

Простота освоения

3

2

4

1

Литература

+

-

+

+

Обучение

-

-

+

+

Знание статистики

1

2

4

3

Удобство работы

2

1

3

4

Визуализация

2

3

1

4

Подготовка к анализу

3

1

4

2

Предварительный анализ

2

3

1

4

Интепретация результатов

+

-

-

-

Ясность результатов

1

2

4

3

В частности, пакет SPSS создавался еще для "больших" машин и последовательно переводился для работы в среде 00$, а затем Windows. Пакет хорошо отработан, приближается по своим возможностям к профессиональным пакетам, и реализация статистических процедур хорошо приспособлена к практической работе.

Пакет Statistiса специально создавался для работы в среде Windows. Отличается наиболее развитым интерфейсом с пользователем; богатыми графическими возможностями.

Пакет STATGRAPHICS разрабатывался для работы в среде DOS, а затем был адаптирован к операционной системе ‚. По своим характеристикам пакет занимает промежуточное положение между SPSS и Statistika.

Электронная таблица. Ехсеl включена в рассмотрение ввиду широкого распространения при простейшем статистическом анализе данных. Важным преимуществом пакета Ехсеl является его русифицированность. Поэтому, в частности, пакет Ехсеl может быть также использован и при оформлении результатов работы.

Заметим, что в настоящее время появляются новые версии рассматриваемых пакетов.

Цифры 1—4 в таблице отражают экспертную оценку автора пре имуществ одного пакета перед другими (1 — высшая степень).

Учитывая, что наиболее простым по освоению является электронные таблицы Excel поэтому далее будут рассмотрены методы обработки медицинских данных с использованием этого пакета, а методы непараметрической статистики с использованием пакета Statistica.