Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы к вопросам 2012_01_03.doc
Скачиваний:
647
Добавлен:
22.02.2016
Размер:
1.64 Mб
Скачать

15. Пакеты прикладных программ по статистическому анализу данных

Все программы статистической обработки данных можно разделить на профессиональные, полупрофессиональные (популярные) и специализированные.

MS Excel. Microsoft Excel (также иногда называется Microsoft Office Excel[1]) — программа для работы с электронными таблицами. Она предоставляет возможности экономико-статистических расчетов, графические инструменты и, язык макропрограммирования VBA (Visual Basic для приложений). MS Excel - это электронная таблица с достаточно мощными математическими возможностями, где некоторые статистические функции являются просто дополнительными встроенными формулами.

SPSS (Statistical Package for Social Science). SPSS Statistics (аббревиатура англ. «Statistical Package for the Social Sciences» — «статистический пакет для социальных наук») — компьютерная программа для статистической обработки данных, один из лидеров рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных науках.

Между 2009 и 2010 название программного обеспечения SPSS было изменено на PASW (Predictive Analytics SoftWare) Statistics. По состоянию на январь 2010 года компания стала называться "SPSS: An IBM Company".

По мнению некоторых авторов, SPSS «занимает ведущее положение среди программ, предназначенных для статистической обработки информации» Отличается гибкостью, мощностью применим для всех видов статистических расчетов.

Возможности

  1. Ввод и хранение данных.

  2. Возможность использования переменных разных типов.

  3. Частотность признаков, таблицы, графики, таблицы сопряжённости, диаграммы.

  4. Первичная описательная статистика.

  5. Маркетинговые исследования

  6. Анализ данных маркетинговых исследований

STATISTICA. Statistica (торговая марка — STATISTICA) — пакет для всестороннего статистического анализа, разработанный компанией StatSoft. В пакете STATISTICA реализованы процедуры для анализа данных(data analysis), управления данными (data management), добычи данных (data mining), визуализации данных (data visualization). Несложный в освоении этот статистический пакет включает большое количество методов статистического анализа (более 250 встроенных функций) объединенных специализированными статистическими модулями.

Существуют различные варианты пакета в зависимости от целей и задач пользователя:

  • однопользовательская версия (Single-User)

  • сетевая версия (Concurrent Network) — для использования в локальных вычислительных сетях

  • Enterprise версия — для использования в вычислительных системах и крупных организациях

  • Web-Based — для использования в крупных сетях через web-браузер.

Структура пакета

  • Пакет STATISTICA имеет модульную структуру. Каждый модуль содержит уникальные процедуры и методы анализа данных: [2]

  • Base — включает в себя обширный выбор основных статистик, широкий набор методов для разведочного анализа.

  • Advanced Linear/Non-Linear Models — предлагает широкий спектр линейных и нелинейных средств моделирования, регрессионный анализ, анализ компонент дисперсий, анализ временных рядов и т. д.

  • Multivariate Exploratory Techniques — многомерные разведочные технологии анализа STATISTICA предоставляет широкий выбор разведочных технологий, начиная с кластерного анализа до расширенных методов классификационных деревьев, в сочетании с бесчисленным набором средств интерактивной визуализации для построения связей и шаблонов

  • QC — Контроль качества — предоставляет широкий спектр аналитических методов управления качеством, а также контрольные карты презентационного качества, непревзойденной гибкости и разнообразия.

  • Neural Networks — (отдельный модуль) единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык

  • Data Miner — интеллектуальный анализ данных

Графика

Система STATISTICA обладает широкими графическими возможностями. STATISTICA включает в себя большое количество разнообразных категорий и типов графиков (включая научные, деловые, трехмерные и двухмерные графики в различных системах координат, специализированные статистические графики — гистограммы, матричные, категорированные графики и др.).

В систему STATISTICA включено большое количество инструментов настройки всех компонент графиков. Имеется возможность выбора различных типов линий, форматов разметки осей, цветов, легенд, названий и других атрибутов графика. Настроенные атрибуты могут быть сохранены в специальном файле и потом применяться к другим графикам. Доступ ко всем основным командам настройки реализован при помощи контекстных меню, которые появляются при нажатии на правую кнопку мыши, общего меню и из панели инструментов графика. STATGRAPHICS PLUS. Довольно мощная статистическая программа. Содержит более 250 статистических функций, генерирует понятные, настраиваемые отчеты. Последняя доступная версия - 5.1. Ее можно получить на сайте http://www.statgraphics.com/ Есть возможность скачать демо-версию. Следует отметить, что ранние версии этой программы были весьма популярны у отечественных исследователей.

MATLAB MATLAB (сокращение от англ. «Matrix Laboratory») — термин, относящийся к пакету прикладных программ для решения задач технических вычислений, а также к используемому в этом пакете языку программирования. MATLAB используют более 1 000 000 инженерных и научных работников, он работает на большинстве современных операционных систем, включая Linux, Mac OS, Solaris и Microsoft Windows

MATLAB предоставляет пользователю большое количество (несколько сотен) функций для анализа данных, покрывающие практически все области математики, в частности:

  1. Матрицы и линейная алгебра — алгебра матриц, линейные уравнения, собственные значения и вектора, сингулярности, факторизация матриц и другие.

  2. Многочлены и интерполяция — корни многочленов, операции над многочленами и их дифференцирование, интерполяция и экстраполяция кривых и другие.

  3. Математическая статистика и анализ данных — статистические функции, статистическая регрессия, цифровая фильтрация, быстрое преобразование Фурье и другие.

  4. Обработка данных — набор специальных функций, включая построение графиков, оптимизацию, поиск нулей, численное интегрирование (в квадратурах) и другие.

  5. Дифференциальные уравнения — решение дифференциальных и дифференциально-алгебраических уравнений, дифференциальных уравнений с запаздыванием, уравнений с ограничениями, уравнений в частных производных и другие.

  6. Разреженные матрицы — специальный класс данных пакета MATLAB, использующийся в специализированных приложениях.

  7. Целочисленная арифметика — выполнение операций целочисленной арифметики в среде MATLAB.

STADIA. Программа российской разработки с 16-и летней историей. Включает в себя все необходимые статистические функции. Она прекрасно справляется со своей задачей - статистическим анализом. Но программа внешне фактически не изменяется с 1996 года. Графики и диаграммы, построенные при помощи STADIA, выглядят в современных презентациях архаично.

STATA. Профессиональный статистический программный пакет. Один из самых популярных в образовательных и научных учреждениях США наряду с SPSS.

JMR. Один из мировых лидеров в анализе данных.

SYSTAT Статистическая система для персональных компьютеров.

NCSS. Программа развивается с 1981 года и рассчитана на непрофессионалов в области статистической обработки. Интерфейс системы многооконный и как следствие – немного непривычный в использовании.

MINITAB 14. Это достаточно удобный в работе программный пакет, имеющий хороший интерфейс пользователя, хорошие возможности по визуализации результатов работы.

STATGRAPHICS PLUS. Довольно мощная статистическая программа. Содержит более 250 статистических функций, генерирует понятные, настраиваемые отчеты.

PRISM. Интуитивно понятный интерфейс позволяет в считанные минуты проанализировать данные и построить качественные графики. Программа содержит основные часто применяемые статистические функции, которых в большинстве исследований будет достаточно.