Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3 часть математика.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
367.51 Кб
Скачать

Ввод данных.

Программа STATISTICA имеет модульную структуру, то есть состоит из модулей, каждый из которых используется для решения своего конкретного класса задач, а именно: анализ временных рядов и прогнозирование, множественная регрессия, нелинейное оценивание, факторный анализ, моделирование структурными уравнениями, непараметрическая статистика, дисперсионный анализ (ANOVA/MANOVA), дискриминантный функциональный анализ. Несколько модулей объединены в группу промышленная статистика: контроль качества, анализ процессов, планирование эксперимента.

При загрузке пакета программ STATISTICA и при создании нового файла появляется электронная таблица, в которой столбцы являются переменными, а строки – наблюдениями. Удобство введения данных в программе STATISTICA обусловлено тем, что файл таблицы похож на аналогичный из программы Excel. Данная программа позволяет импортировать данные из других Windows приложений и программ DOS, таких как: MS Excel, MS Access, FoxPro, Paradox, dBASE, CSV, SPSS, а также из файлов *.txt.

В отличие от STATISTICA приложение Eviews не имеет модульной системы, однако оно содержит так называемое окно рабочего файла, где можно сохранять ряд объектов.

 

Объектная структура рабочего окна позволяет работать одновременно с различными типами информации. Управление объектами осуществляется с помощью процедур (procs), которые в свою очередь могут сами создавать новые объекты. Каждый объект содержит конкретный вид информации: ряд данных, коэффициенты, графики и диаграммы, модели, результаты вычислений, таблицы (матрицы) и др. Все типы объектов представлены на рис. 3.

Кроме того, программа Eviews имеет командную строку, куда вводятся определенные команды позволяющие производить статистический анализ данных. Команды могут быть сохранены в отдельном файле, что позволяет исследователю запомнить ретроспективу выполняемых действий.

В отличие от программы STATISTICA в Eviews прежде, чем ввести данные, необходимо задать их формат, далее создать объект типа ряд, задать количество переменных и количество наблюдений. Пакет Eviews позволяет работать с восьмью типами данных (годовые, полугодовые, квартальные, месячные, недельные (5 дней), недельные (7 дней), ежедневные и недатированные наблюдения). Процедура ввода и описания данных в приложении Eviews сложнее, чем в STATISTICA, и поэтому предпочтительнее импортировать данные из других приложений. Программа позволяет работать с данными заимствованными из таких программ как: MS Access, Gauss, ODBS, SAS, SPSS, MS Excel, Stata, ACSII, HTML.

Рис. 2. Вид рабочего окна программы Eviews. 

Рис. З. Типы объектов рабочего файла Eviews 

2.2. Графический анализ и основные описательные статистики.

Для того чтобы легко визуализировать как исходные параметры модели, так и конечные результаты вычислений необходимо построение различных графиков, диаграмм, коррелограмм, спектрограмм и т.п. Просмотр в графической интерпретации исходных данных в виде линейных графиков, гистограмм распределений вероятности, диаграмм и т.п. для обоих приложений осуществляется с помощью команд меню. Просмотр результатов в виде графиков в программе STATISTICA производится непосредственно из рабочего модуля с помощью соответствующих кнопок, причем это приложение позволяет задать опцию построения графика автоматически после каждой проведенной процедуры, также имеется возможность просмотра данных в разных масштабах. Построение коррелограмм АКФ и ЧАКФ в пакете STATISTICA осуществляется только в разных окнах, в Eviews же их можно просмотреть и в одном окне, но зато в STATISTICA указаны границы белого шума. Результаты моделирования в Eviews в графическом режиме можно просмотреть с помощью команд основного меню рабочего файла.

Просмотр числовых характеристик исследуемых данных (среднее значение, стандартное отклонение, эксцесс, вероятность и др.) в приложении Eviews осуществляется с помощью команд меню, чтобы сделать это в STATISTICA необходимо зайти в отдельный модуль Основные статистики/Таблицы (Basic Statistics/Tables) (здесь же имеются критические значения различных распределений). Набор описательных статистик для обоих пакетов одинаковый.

2.3. Регрессионный анализ.

1. линейная регрессия. В программе STATISTICA оценка коэффициентов однофакторной и многофакторной линейной регрессии осуществляется в отдельном модуле Множественная регрессия (Multiple regression). Результаты просматриваются в отдельном окне, где есть коэффициенты, оцененные методом наименьших квадратов, коэффициент детерминации, статистика Фишера оценки значимости регрессии, статистики Стьюдента оценки значимости коэффициентов, коэффициент корреляции (матрица корреляций), статистика ДарбинаУотсона [3]. Существенными недостатками приложения STATISTICA является: во-первых, тот факт, что оценка коэффициентов простой регрессии производится только методом наименьших квадратов; во-вторых, определение наличия гетероскедастичности остатков приходится проводить в отдельном модуле (а именно, с помощью теста Спирмена в модуле непараметрические статистики). В отличие от STATISTICA пакет Eviews позволяет проводить оценку регрессии не только методом наименьших квадратов, но также методами максимального правдоподобия, взвешенным и нелинейным методами наименьших квадратов, достаточно просто набрать название метода в командной строке при оценке коэффициентов модели. К тому же Eviews позволяет сделать поправку на гетероскедастичность с учетом характера зависимости ошибок от независимой переменной. С помощью команды меню гетероскедастичность определяется тестом Уайта [1]. Отметим, что с помощью командной строки можно задать методику выявления гетероскедастичности методами Парка, Глейзера и др.

Проблему мультиколлинеарности факторов можно преодолеть в программе STATISTICA двумя способами: найти оценки методом главных компонент (реализуемо в модуле Факторный анализ (Factor Analysis)) или использовать гребневую регрессию (возможно только для STATISTICA версии старше 6.0).

2. нелинейная регрессия. Оценка нелинейной регрессии в программе STATISTICA производится в отдельном модуле Нелинейное оценивание (Non-linear estimation), здесь можно как задать вид зависимости самостоятельно, так и воспользоваться имеющимися: регрессия логит/пробит, регрессия экспоненциального роста, кусочно-линейная регрессия [3]. Для оценки коэффициентов нелинейной регрессии произвольного вида используются итеративные методы, такие как квази-ньютоновский, Хука-Дживса, симплексный и др. Результатами оценки являются лишь индекс детерминации и статистика Фишера. Подбор вида гладкой функции можно осуществить только на основе визуального анализа графиков. В отличие от этого в программе Eviews подобрать нелинейную функцию, наилучшим образом отражающей зависимость, можно на основе теста Бокса-Кокса. Оценка коэффициентов осуществляется на основе нелинейного МНК (NLS) и взвешенного МНК (WLS).

3. модели с дискретной зависимой переменной. Модели бинарного выбора (логит/пробит модели) легко оцениваются в пакете STATISTICA в модуле Нелинейное оценивание, выходными данными служат логарифмическая функция правдоподобия, ограниченная логарифмическая функция правдоподобия, ч2-статистика, оцененные методом максимального правдоподобия параметры модели. В отличие от STATISTICA Eviews позволяет строить не только модели бинарного выбора, но также и модели множественного выбора, как с порядковыми, так и с неупорядоченными альтернативами. Для этого просто в поле выбора метода оценивания следует сделать выбор в пользу метода, соответствующего искомой модели. Выходными параметрами служат ч2-статистика, псевдо-коэффициент детерминации, логарифмические функции правдоподобия.

Источник: statosphere.ru