
Стат. обр. 4195-96. 2014 / Конспект лекции 1.Доб. таблица
.docxСравнение ППП статистического анализа
Сравнение программ проведем по основным выполняемым ими процедурам.
· Ввод данных.
· Графический анализ.
· Основные описательные статистики.
· Регрессионный анализ (линейная, множественная и нелинейная регрессия).
· Анализ временных рядов (адаптивные модели прогнозирования, методы выделения компонент временного ряда, модели с распределенными лагами).
· Моделирование стационарных и нестационарных случайных процессов (модели ARMA, ARIMA, ARCH, коинтеграция рядов).
· Работа.
|
Statistica |
MatLab |
Excel |
SPSS |
|
Ввод данных |
Модульная структура |
При загрузке системы на мониторе появляется основное окно системы, в котором можно выделить окно команд (Command-Window). Система готова к проведению вычислений и созданию программ в командном режиме.
|
Можно вводить в таблицы любую информацию: текст, числа, даты и время, формулы, рисунки, диаграммы, графики. Вся вводимая информация может быть обработана при помощи специальных функций. |
Интерфейс программы SPSS имеет две рабочих области: 1. Dataview (Данные) – окно данных, в которое выводятся результаты обработкиданных. 2.Variableview (переменные) – окно переменных, в которое вводятся значения ИСД для обработки.
|
|
Графический анализ |
Производится непосредственно из рабочего модуля с помощью соответствующих кнопок |
Начиная с версии 4.0 в состав системы MATLAB входит мощная графическая подсистема, которая поддер-живает как средства визуали-зации двумерной и трех-мерной графики на экран терминала, так и средства презентационной графики |
В Excel можно строить два типа диаграмм: внедренные и диаграммы на отдельных листах при создании отчетов. |
Графический вывод. Выводит-ся в окне просмотра в виде блоков, причём каждый блок является отдельным объектом. |
|
Основные описательные статистики |
Осуществляется только в разных окнах |
Графические команды высокого уровня автомати-чески контролируют масш-таб, выбор цветов, не требуя манипуляций со свойствами графических объектов. |
Excel предлагает различные типы диаграмм и предусмат-ривает широкий спектр возможностей для их изменения (типа диаграммы, надписей, легенды и т.д.) и для форматирования всех объектов диаграммы.
|
Можно производить поиск необходимых элементов, переставлять их местами, копировать, удалять и т.д.
|
|
Регрессион-ный анализ |
|
|
|
|
|
- линейная регрессия |
Осуществляется в отдельном модуле Множественная регрессия; резуль-таты просматри-ваются в отдель-ном окне |
Для построения регрессии используется метод наимень-ших квадратов (МНК), но результат при этом получается тот, который и ожидался - без потери значимости. |
С помощью функции ЛИНЕЙН: рассчитывает ста-тистику для ряда с приме-нением МНК, чтобы пост-роить прямую линию, которая наилучшим образом аппрок-симирует имеющиеся данные.
|
В линейном регрессионном анализе, все наблюдения входят в модель равнозначно. При этом, исходной предпо-сылкой является тот факт, что все наблюдения должны иметь одинаковую дисперсию. |
|
- нелинейная регрессия |
Производится в отдельном модуле Нелинейное оценивание, здесь можно как задать вид зависимости самостоятельно, так и воспользоваться имеющимися. Для оценки коэффициентов нелинейной регрессии произвольного вида используются итеративные методы. |
Имеется возможность выполнения регрессии с приближением к функции общего вида в виде весовой суммы функций fn(x). При этом сами функции fn(x) могут быть любого, в том числе нелинейного типа. С одной стороны, это резко повышает возможности аналитического отображения функций регрессии. Но, с другой стороны, это требует от пользователя определенных навыков аппроксимации экспериментальных данных комбинациями достаточно простых функций. |
Если функция регрессии определена, интерпретирована и обоснована, и оценка точности регрессионного анализа соответствует требованиям, можно считать, что построенная модель и прогнозные значения обладают достаточной надежностью. |
Согласно предварительным установкам при расчете нелинейной регрессии происходит минимизация суммы квадратов остатков. |
|
- модели с дискретной зависимой переменной |
Модели бинарного выбора (логит/пробит модели) легко оцениваются в модуле Нелинейное оценивание. |
Позволяет моделировать, имитировать и анализировать непрерывные и дискретные линейные и нелинейные динамические системы |
В MicrosoftExcel вплоть до 2003 версии включительно, использовался свой собственный бинарный формат файлов (BIFF) в качестве основного. |
С помощью метода бинарной логистической регрессии можно исследовать зависимость дихотомических переменных от независимых переменных, имеющих любой вид шкалы.
|
|
Анализ временных рядов |
Анализ временных рядов осуществляется в модуле Анализ Временных рядов/Прогнозирование (TimeSeriesanalysis/ forecasting). |
NeuralNetworkToolbox – мощный инструмент прогнозирования временных рядов в MATLAB. |
MicrosoftExcel располагает функцией ExponentialSmoothing (Экспоненциальное сглаживание), которая обычно используется для сглаживания уровней эмпирической временного ряда на основе метода простого экспоненциального сглаживания. |
Мощным инструментом анализа временных рядов и прогнозирования является модуль SPSSTrends. SPSS Trends позволяет анализировать информацию о прошлом и предсказывать будущее.
|
|
Моделирова-ние стационар-ных и неста-ционарных случайных процессов |
|
|
|
|
|
-мод - моделирование стационарных процессов
|
Существенным недостатком программы является отсутствие возможностей проверки ряда на стационарность, и судить о его стационарности можно лишь на основе визуального анализа графика ряда, спектрограммы и коррелограмм АКФ и ЧАКФ. Построение модели стационарных рядов, учитывающих изменение дисперсии (модели ARCH и GARCH) в STATISTICA не возможно. |
На выходе получается нормально распределенный случайный процесс с корреляционной функцией, вид которой определяется типом формирующего фильтра как динамического звена.
|
|
|
|
-моделирование нестационарных рядов |
С помощью процедуры преобразования ряда вычисляют разности до тех пор, пока ряд не станет стационарным, причем стационарность можно проверить лишь на основе визуального анализа, далее идентифицируют и строят модель АРСС. |
Моделирование уравнений может быть произведено в системе SimulinkMatlab. Адекватность результатов моделирования процесса может быть оценена построением соответствующих гистограмм. |
|
|
|
Работа |
В программе нет необходимости запоминать все команды ввода в командной строке. В ней проще работать с вводом данных, строить регрессионные модели, исследовать структуру временного ряда. |
Отсутствие интерактивности делает его неудобным при выполнении поисковых, исследовательских расчетов для новых, неисследованных массивов данных.
|
В состав MicrosoftExcel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет выполнен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. |
Для проведения анализа часто бывает необходимо выполнить преобразование данных. На основе первоначально собранных данных можно создать новые переменные и изменить кодирование. Подобные преобразования называются модификацией данных.
|
Выводы:
На какой программе остановить свой выбор? Безусловно, дороговизна программ не позволяет их менять. Поэтому имеет смысл посмотреть демо-версии, разобраться с работой и потом делать окончательный вывод. Русскоязычные версии (с документацией) имеют только SPSS и Statistica. Что касается возможных рекомендаций, то они следующие:
- Если нужен мощный, общепризнанный пакет с простым и понятным даже начинающим пользователям интерфейсом, то лучше воспользоваться SPSS.
- Для начинающих и профессионалов, которым нужна подсказка и развитая документация на русском языке, можно рекомендовать Statistica. Это мощное приложение с профессиональными возможностями.
- Для непритязательных пользователей, которые ограничиваются в своих исследованиях стандартными статистическими методами можно рекомендовать программы Excel и MatLab.