Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы 2013.doc
Скачиваний:
6
Добавлен:
01.04.2025
Размер:
2.37 Mб
Скачать

34. Программы статистической обработки данных. Прогнозирование.

Методы статистической обработки данных используются во многих ППП, например, Excel, QuattroPro, Lotus 1-2-3, MathCAD. Большими возможностями обладают специализированные ППП статистической обработки данных, предназначенные для специалистов со специальной подготовкой в области теории статистики. К ним относятся:

  • ППП SPSS – разработчик SPSS inc.

  • ППП STATISTICA используется в экономической статистике, финансах, научных исследованиях, производстве (разработчик StatSost)

MS Excel. Самой часто упоминаемой (и используемой) в отечественных статьях является приложение MS Excel из пакета офисных программ компании Microsoft ? MS Office. Причины этого кроются в широком распространении этого программного обеспечения, наличии русскоязычной версии, тесной интеграцией с MS Word и PowerPoint. Однако, MS Excel - это электронная таблица с достаточно мощными математическими возможностями, где некоторые статистические функции являются просто дополнительными встроенными формулами. Расчеты сделанные при ее помощи не признаются авторитетными биомедицинскими журналами. Также в MS Excel невозможно построить качественные научные графики. Безусловно, MS Excel хорошо подходит для накопления данных, промежуточного преобразования, предварительных статистических прикидок, для построения некоторых видов диаграмм. Однако окончательный статистический анализ необходимо делать в программах, которые специально созданы для этих целей. Существует макрос-дополнение XLSTAT-Pro http://www.xlstat.com для MS Excel который, включает в себя более 50 статистических функций, включая анализ выживаемости, которых в основных случаях достаточно для обычного применения. Пробную версию макроса можно взять на сайте производителя.

STADIA. Программа отечественной разработки с 16-и летней историей. Включает в себя все необходимые статистические функции. Она прекрасно справляется со своей задачей - статистическим анализом. Но. Программа внешне фактически не изменяется с 1996 года. Графики и диаграммы, построенные при помощи STADIA, выглядят в современных презентациях архаично. Цветовая гамма программы (красный шрифт на зеленом) очень утомляет в работе. К положительным качествам программы можно отнести русскоязычный интерфейс и наличие книг описывающих работу. Например: Кулаичев А.П. Методы и средства анализа данных в среде Windows. - М: ИнКо, 2002. - 341 с. Со страницы http://www.protein.bio.msu.su/~akula/index.htm можно взять демо-версию STADIA.

STATA. Профессиональный статистический программный пакет с data-management system, который может применятся для биомедицинских целей. Один из самых популярных в образовательных и научных учреждениях США наряду с SPSS. Официальный сайт http://www.stata.com Программа хорошо документирована, издается специальный журнал для пользователей системы. Однако возможности предварительного ознакомления с демо-версией нет.

ППП STATISTICA содержит полный набор статистических методов анализа данных, в том числе нейронные сети, и высококачественную графику (сотни типов графиков).

Состоит из следующих частей (окон):

  • таблицы исходных данных

  • Графики

  • Таблицы результатов

Лист рабочей книги файл (например, с исходными данными) - *.sta График *.stw

Данные организованы в виде электронной таблицы:

  • Столбцы – это переменные Variable

  • Строки – это наблюдения Cases

Характерная черта ППП – внизу панель анализа, на которой располагается значок свернутого окна доступа к различным видам анализа, возврата на предыдущие шаги и др. опции. Не следует закрывать это окно до конца анализа данных.

Нейронные сети – используются когда другие виды анализа неприменимы, т.е.:

  • анализ данных со сложной нелинейной структурой зависимостей

  • распознавание и классификация

  • нелинейное понижение размерности

ППП SPSS

Содержит полный набор статистических методов анализа данных, кроме нейронных сетей, модульную структуру, отличается низкой стоимостью.

Предлагаются следующие процедуры:

  • Общая линейная модель (GLM) содержит модели:

линейная регрессия,

одномерный дисперсионный анализ,

одномерный ковариационный анализ,

многомерный дисперсионный анализ

многомерный ковариационный анализ и др.

  • Смешанная линейная модель (Mixed) содержит модели:

Однофакторный дисперсионный анализ (ANOVA) с фиксированными эффектами

рандомизированные полные блоки

случайные эффекты

случайные коэффициенты

многоуровневый анализ,

безусловная модель линейного роста,

модель линейного роста с ковариатами,

модель повторных измерений с ковариатами, зависящими от времени и др.

  • Политомическая (PLUM) - универсальная логит модель (дает возможность предсказывать порядковые исходы с более чем двумя категориями. Например, можно исследовать факторы, влияющие на уровень интереса (низкий, средний, высокий) покупателей к товару.

  • Оценка компонент дисперсии (VARCOMP) - ряд методов оценки компонент дисперсии для каждого случайного эффекта в смешанных моделях.

  • Анализ выживаемости

  • Многовходовые таблицы сопряженности (LOGLINEAR)

  • Иерархические Многовходовые таблицы сопряженности (HILOGLINEAR)

  • Подгонка моделей к данным (GENLOG)

  • Оценка временного интервала

  • Пропорциональные риски с зависящими от времени ковариатами