Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Стат. обр. 4195-96. 2014 / Конспект лекции 1.Доб. таблица

.docx
Скачиваний:
68
Добавлен:
12.03.2015
Размер:
28.97 Кб
Скачать

Сравнение ППП статистического анализа

Сравнение программ проведем по основным выполняемым ими процедурам.

· Ввод данных.

· Графический анализ.

· Основные описательные статистики.

· Регрессионный анализ (линейная, множественная и нелинейная регрессия).

· Анализ временных рядов (адаптивные модели прогнозирования, методы выделения компонент временного ряда, модели с распределенными лагами).

· Моделирование стационарных и нестационарных случайных процессов (модели ARMA, ARIMA, ARCH, коинтеграция рядов).

· Работа.

Statistica

MatLab

Excel

SPSS

Ввод данных

Модульная структура

При загрузке системы на мониторе появляется основное окно системы, в котором можно выделить окно команд (Command-Window). Система готова к проведению вычислений и созданию программ в

командном режиме.

Можно вводить в таблицы любую информацию: текст, числа, даты и время, формулы, рисунки, диаграммы, графики. Вся вводимая информация может быть обработана при помощи специальных функций.

Интерфейс программы SPSS имеет две рабочих области:

1. Dataview (Данные) – окно данных, в которое выводятся результаты обработкиданных.

2.Variableview (переменные) – окно переменных, в которое вводятся значения ИСД для обработки.

Графический анализ

Производится непосредственно из рабочего модуля с помощью соответствующих кнопок

Начиная с версии 4.0 в состав системы MATLAB входит мощная графическая подсистема, которая поддер-живает как средства визуали-зации двумерной и трех-мерной графики на экран терминала, так и средства презентационной графики

В Excel можно строить два типа диаграмм: внедренные и диаграммы на отдельных листах при создании отчетов.

Графический вывод. Выводит-ся в окне просмотра в виде блоков, причём каждый блок является отдельным объектом.

Основные описательные статистики

Осуществляется только в разных окнах

Графические команды высокого уровня автомати-чески контролируют масш-таб, выбор цветов, не требуя манипуляций со свойствами графических объектов.

Excel предлагает различные типы диаграмм и предусмат-ривает широкий спектр возможностей для их изменения (типа диаграммы, надписей, легенды и т.д.) и для форматирования всех объектов диаграммы.

Можно производить поиск необходимых элементов, переставлять их местами, копировать, удалять и т.д.

Регрессион-ный анализ

- линейная регрессия

Осуществляется в отдельном модуле Множественная регрессия; резуль-таты просматри-ваются в отдель-ном окне

Для построения регрессии используется метод наимень-ших квадратов (МНК), но результат при этом получается тот, который и ожидался - без потери значимости.

С помощью функции ЛИНЕЙН: рассчитывает ста-тистику для ряда с приме-нением МНК, чтобы пост-роить прямую линию, которая наилучшим образом аппрок-симирует имеющиеся данные.

В линейном регрессионном анализе, все наблюдения входят в модель равнозначно. При этом, исходной предпо-сылкой является тот факт, что все наблюдения должны иметь одинаковую дисперсию.

- нелинейная регрессия

Производится в отдельном модуле Нелинейное оценивание, здесь можно как задать вид зависимости самостоятельно, так и воспользоваться имеющимися. Для оценки коэффициентов нелинейной регрессии произвольного вида используются итеративные методы.

Имеется возможность выполнения регрессии с приближением к функции общего вида в виде весовой суммы функций fn(x). При этом сами функции fn(x) могут быть любого, в том числе нелинейного типа. С одной стороны, это резко повышает возможности аналитического отображения функций регрессии. Но, с другой стороны, это требует от пользователя определенных навыков аппроксимации экспериментальных данных комбинациями достаточно простых функций.

Если функция регрессии определена, интерпретирована и обоснована, и оценка точности регрессионного анализа соответствует требованиям, можно считать, что построенная модель и прогнозные значения обладают достаточной надежностью.

Согласно предварительным установкам при расчете нелинейной регрессии происходит минимизация суммы квадратов остатков.

- модели с дискретной зависимой переменной

Модели бинарного выбора (логит/пробит модели) легко оцениваются в модуле Нелинейное оценивание.

Позволяет моделировать, имитировать и анализировать непрерывные и дискретные линейные и нелинейные динамические системы

В MicrosoftExcel вплоть до 2003 версии включительно, использовался свой собственный бинарный формат файлов (BIFF) в качестве основного.

С помощью метода бинарной логистической регрессии можно исследовать зависимость дихотомических переменных от независимых переменных, имеющих любой вид шкалы.

Анализ временных рядов

Анализ временных рядов осуществляется в модуле Анализ Временных рядов/Прогнозирование (TimeSeriesanalysis/ forecasting).

NeuralNetworkToolbox – мощный инструмент прогнозирования временных рядов в MATLAB.

MicrosoftExcel располагает функцией ExponentialSmoothing (Экспоненциальное сглаживание), которая обычно используется для сглаживания уровней эмпирической временного ряда на основе метода простого экспоненциального сглаживания.

Мощным инструментом анализа временных рядов и прогнозирования является модуль SPSSTrends. SPSS Trends позволяет анализировать информацию о прошлом и предсказывать будущее.

Моделирова-ние стационар-ных и неста-ционарных случайных процессов

-мод - моделирование

стационарных

процессов

Существенным недостатком программы является отсутствие возможностей проверки ряда на стационарность, и судить о его стационарности можно лишь на основе визуального анализа графика ряда, спектрограммы и коррелограмм АКФ и ЧАКФ.

Построение модели стационарных рядов, учитывающих изменение дисперсии (модели ARCH и GARCH) в STATISTICA не возможно.

На выходе получается нормально распределенный случайный процесс с корреляционной функцией, вид которой определяется типом формирующего фильтра как динамического звена.

-моделирование нестационарных рядов

С помощью процедуры преобразования ряда вычисляют разности до тех пор, пока ряд не станет стационарным, причем стационарность можно проверить лишь на основе визуального анализа, далее идентифицируют и строят модель АРСС.

Моделирование уравнений может быть произведено в системе SimulinkMatlab. Адекватность результатов моделирования процесса может быть оценена построением соответствующих гистограмм.

Работа

В программе нет необходимости запоминать все команды ввода в командной строке.

В ней проще работать с вводом данных, строить регрессионные модели, исследовать структуру временного ряда.

Отсутствие интерактивности делает его неудобным при выполнении поисковых, исследовательских расчетов для новых, неисследованных массивов данных.

В состав MicrosoftExcel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет выполнен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон.

Для проведения анализа часто бывает необходимо выполнить преобразование данных. На основе первоначально собранных данных можно создать новые переменные и изменить кодирование. Подобные преобразования называются модификацией данных.

Выводы:

На какой программе остановить свой выбор? Безусловно, дороговизна программ не позволяет их менять. Поэтому имеет смысл посмотреть демо-версии, разобраться с работой и потом делать окончательный вывод. Русскоязычные версии (с документацией) имеют только SPSS и Statistica. Что касается возможных рекомендаций, то они следующие:

- Если нужен мощный, общепризнанный пакет с простым и понятным даже начинающим пользователям интерфейсом, то лучше воспользоваться SPSS.

- Для начинающих и профессионалов, которым нужна подсказка и развитая документация на русском языке, можно рекомендовать Statistica. Это мощное приложение с профессиональными возможностями.

- Для непритязательных пользователей, которые ограничиваются в своих исследованиях стандартными статистическими методами можно рекомендовать программы Excel и MatLab.