Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КОМПЬЮТЕРИЗОВАННЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ ДЛЯ ИС...doc
Скачиваний:
5
Добавлен:
01.05.2025
Размер:
4.27 Mб
Скачать

Пакет statistica

Несложные статистические методы можно, конечно, применять и "вручную". Однако в наше время, как правило, используются пакеты прикладных статистических программ, широко доступные пользователям персональных компьютеров и содержащие широкий набор методов, включая наиболее "продвинутые". Основной задачей данной главы является прежде всего пояснение тех методов, которые предлагают пользователям эти пакеты. Без правильного понимания методического аппарата невозможны ни правильный выбор соответствующих методов, ни корректная интерпретация массы результатов, которые пользователь получает при работе с каждым из этих методов.

Иллюстрация методов работы в этой главе будет ориентирована на статистический пакет STATISTICA для Windows. Этот программный продукт фирмы StatSoft полностью совместим со всеми возможностями оболочки Windows и по своему дизайну прекрасно соответствует системе Microsoft Office, отдельные элементы которой уже рассматривались в предыдущих главах. Особенно много сходства у пакета STATISTICA с табличным процессором Excel. Это не удивительно, поскольку именно "идеология" электронных таблиц положена в основу модуля организации данных (Data Management) в пакете STATISTICA. Возможности ввода, редактирования, кодировки, сортировки и т.п., которые так прекрасно выполняют табличные процессоры, наряду с богатейшим выбором типов графического представления данных – все это снимает обычные (и справедливые – что касается таких известнейших пакетов, как Statgraphics или SPSS в версиях для DOS) упреки в адрес статистических пакетов, уделяющих недостаточное внимание подготовке, организации и визуализации данных.

Перечислим коротко, что к числу возможностей организации данных в пакете STATISTICA относятся:

  • ввод данных непосредственно в таблицу;

  • экспорт данных из таких пакетов, как Lotus/Quattro, Excel, SPSS, dBASE, чтение обычных ASCII-файлов;

  • добавление, удаление, перемещение, копирование и переименование строк и столбцов таблицы (объектов и признаков);

  • создание новых признаков на основе исходных (подсчет процентов и долей, относительных и суммарных показателей и т.п.).

ЧАСТЬ I

СТАТИСТИЧЕСКОЕ ОПИСАНИЕ

ГЛАВА 1

ДЕСКРИПТИВНАЯ СТАТИСТИКА

Для более глубокого исследования материала необходимы обобщающие количественные показатели, раскрывающие общие свойства статистической совокупности. Эти показатели, во-первых, дают общую картину, показывают тенденцию развития процесса или явления, нивелируя случайные индивидуальные отклонения, во-вторых, позволяют сравнивать различные совокупности и, наконец, используются во всех разделах математической статистики при более полном и сложном анализе статистического материала. Статистические характеристики описывают параметры т.н. эмпирического распределения признака.

1.1. Основные статистические характеристики

Эти параметры можно разделить на две основные группы: меры среднего уровня и меры рассеяния (разброса).

1.1.1. Меры среднего уровня

К ним относятся:

  1. среднее (арифметическое) значение – сумма всех значений, отнесенная к общему числу наблюдений (принятые обозначения: Mean или ), т.е. средним арифметическим значением признака называется величина

,

где – значение признака у i-го объекта, n – число объектов в совокупности.

  1. минимум – минимальное значение переменной (Min)

  1. максимум – максимальное значение переменной (Max)

  1. мода – наиболее часто встречающееся значение переменной (M)

  1. медиана – среднее по порядку значение (принятые обозначения: Median, m). Медиана – это "срединное" значение признака в том смысле, что у половины объектов совокупности значения этого признака меньше, а у другой половины – больше медианы. Вычислить медиану можно таким образом: упорядочить все значения признака по возрастанию (убыванию) и найти число в этом вариационном ряду, которое либо имеет номер (n+1)/2 – в случае нечетного n, либо находится посередине между числами с номерами n/2 и (n+2)/2 – в случае четного n 1.

Не все из перечисленных характеристик можно вычислять для качественных признаков. Если признак качественный и номинальный, то для него можно найти только моду (ее значением будет название наиболее часто встречающейся категории номинального признака). Если признак ранговый, то кроме моды для него можно найти еще и медиану, а также минимум и максимум. Однако среднее арифметическое значение можно вычислять только для количественных признаков.

В случае количественных данных все характеристики среднего уровня, очевидно, измеряются в тех же единицах, что и сам исходный признак. Если все значения исходного признака изменятся в несколько раз или на некоторое число, то же самое произойдет и со всеми средними величинами для этого признака.