Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Биометрическая обработка данных на основе компь...doc
Скачиваний:
31
Добавлен:
11.11.2019
Размер:
1.7 Mб
Скачать

1.2. Статистические методы программы statistica

В пакете STATISTICA статистические методы разделены на тринадцать групп: основные статистики/таблицы, множественная регрессия, анализ вариантов (дисперсионный анализ), непараметрические данные, настройка распределения, дополнительные линейные/нелинейные модели, многомерные исследовательские методы, индустриальная статистика, анализ мощности, информационная проходка, статистика данных блока, STATISTICA Visual Basic, подсчет вероятности.

Метод Основные статистики является наиболее часто используемым на начальном этапе обработки данных, вычисляет описательные статистики, оценивает линейную зависимость между переменными, определяет степень различия двух выборок по средним значениям и дисперсии; проводит однофакторный дисперсионный анализ, оценивает различными способами частоты.

Большинство методов Основной статистики относятся к методам параметрической статистики, основывающихся на предположении, что распределение выборок соответствует нормальному типу. Перед применением параметрических критериев проводится проверка выборочных распределений на нормальность.

На основе математических методов можно установить характер взаимосвязей различных переменных и степень их воздействия на интересующий исследователя результат. В таких исследованиях широко используется метод Множественной регрессии. Регрессионный анализ тесно связан с другими статистическими методами – методами множественного корреляционного и дисперсионного анализа. В отличие от корреляционного анализа, исследующего направление и силу статистической связи переменных, регрессионный анализ исследует вид зависимости переменной, т.е. математические модели зависимости количественной или качественной переменной от одной или нескольких других количественных переменных. Регрессионный анализ используют при определении математической функции (модели), отражающей зависимость между экспериментальными количественными переменными, проверке гипотезы о соответствии выбранной модели экспериментальным данным, прогнозировании значений зависимой переменной при новых значениях независимой переменной.

Дисперсионный анализ используют при решении статистических задач, связанных с оценкой влияния одной или нескольких качественных переменных (факторов) на одну зависимую количественную переменную. Дисперсионный анализ применим и к количественным факторам, если их значения могут быть группированы в классы или блоки (такие данные допускают и более детальное исследование зависимости отклика от факторов, выполняемое методами регрессионного анализа).

Непараметрические методы – методы вычисления основных статистических показателей, характеризующих малые выборки, распределение которых не соответствует нормальному типу. Базируются эти методы, как правило, только на предположениях о независимости наблюдений, случайном характере исходных данных, о непрерывности генеральной совокупности, из которой они извлечены. В параметрических ситуациях (когда выполняются условия применения параметрических методов), непараметрические процедуры обычно обладают меньшей точностью по выявлению различий, чем их параметрические аналоги, но они более объективны в ситуациях, когда параметрические процедуры неприменимы: для номинальных или ранговых переменных, для выборок с произвольным распределением или малочисленных выборок. Непараметрические критерии разделены на группы в соответствии с теми свойствами данных, к которым они применимы.

При обработке экспериментальных данных возникает необходимость аппроксимировать эмпирическое распределение тем или иным известным законам распределения. Для этой цели в программе STATISTICA предназначен метод Настройка распределения. На основе сравнения наблюдаемых и ожидаемых частот программа определяет тип распределения непрерывных и дискретных переменных.

Дополнительные линейные / нелинейные модели (или углубленные методы анализа) в программе STATISTICA представлены: общими линейными, обобщенными линейными и нелинейными, общими регрессионными моделями, моделями частных наименьших квадратов, анализом выживаемости (исследование характеристик интервалов времени между последовательным возникновением критических событий), логлинейный (или регистрационно-линейный) анализ таблиц частот (используется для выявления факторов в значительной мере, определяющих уровень частот), временные ряды и прогнозирование.

Временным рядом называют совокупность последовательных изменений переменной (процесса), произведенных через одинаковые интервалы времени или пространственной координаты. Анализ временных рядов решает следующие задачи: исследование структуры временного ряда (изменение среднего уровня – тренда), наличие периодических колебаний, построение математической модели процесса, представленного временным рядом, прогнозирование развития процесса, исследование взаимосвязи между временными рядами, преобразование временного ряда средствами сглаживания и фильтрации.

Многомерные методы исследуют различные формы ассоциации (близости, связи, подобия) между несколькими переменными или объектами. Используют многомерные методы (дискриминантный, кластерный, факторный, многомерное шкалирование) для описания исследуемого явления, объекта или системы, выделения в этом пространстве наиболее значимых координат.

Промышленная статистика (или методы контроля качества) предназначена для контроля управления процесса, планирования эксперимента.

Контрольные вопросы

1. Какие статистические методы включает компьютерная программа STATISTICА? 2. При решении, каких задач используются параметрические тесты? 3. При каком типе распределения применяются непараметрические критерии? 4. Объясните разницу между регрессионным и дисперсионным анализом. 5. Какие задачи решаются на основе анализа временных рядов? 6. При решении, каких задач используются методы корреляционного анализа?