
- •Предисловие
- •Введение
- •1 Первичная обработка статистических данных.
- •1.1 Проверка данных
- •1.2 Группировка статистических данных
- •1.3 Графическое представление статистических данных
- •1.4 Задача 1. Первичная обработка
- •2 Точечные оценки параметров распределения.
- •2.1 Несгруппированные статистические данные
- •2.2 Статистические дискретный и интервальный ряды
- •2.3 Метод “условного нуля”
- •2.2.4 Задача 1. Точечные оценки
- •Выборочное среднее квадратическое отклонение равно
- •Выборочное среднее квадратическое отклонение равно
- •3 Интервальные оценки параметров распределения
- •3.1 Доверительные интервалы для некоторых параметров распределения
- •3.2 Примеры построения доверительных интервалов
- •4 Проверка статистических гипотез
- •4.1 Сравнение двух дисперсий нормально распределенных генеральных совокупностей
- •4.2 Сравнение двух математических ожиданий нормально распределенных генеральных совокупностей, дисперсии которых неизвестны и одинаковы
- •4.3 Сравнение двух вероятностей биномиальных распределений
- •4.4 Проверка гипотезы о виде распределения генеральной совокупности по критерию Пирсона
- •4.5 Проверка гипотезы о виде распределения генеральной совокупности по критерию Колмогорова-Смирнова
- •4.6 Примеры
- •Выборочное среднее квадратическое отклонение равно
- •5 Элементы корреляционного и регрессионного анализа
- •5.1 Корреляционное поле
- •5.2 Эмпирическая ломаная регрессии
- •5.3 Эмпирический коэффициент детерминации и эмпирическое корреляционное отношение
- •5.4 Линейная регрессия
- •5.5 Проверка коэффициента корреляции на значимость.
- •5.6 Теоретический коэффициент детерминации и теоретическое корреляционное отношение
- •5.7 Нелинейная корреляция
- •5.8 Множественная регрессия
- •5.9 Оценка погрешности модели
- •5.10 Задача 1. Установления корреляционной зависимости
- •Реализация статистических расчетов при помощи компьютера
- •6.1 Табличный процессор Microsoft Excel
- •6.2 Пакет программ statistica
- •Задачи для самостоятельного решения
- •Вариант № 1
- •Вариант № 2
- •Вариант № 3
- •Вариант № 4
- •Вариант № 5
- •Вариант № 6
- •Вариант № 7
- •Вариант № 8
- •Вариант № 9
- •Вариант № 10
- •Вариант № 11
- •Вариант № 12
- •Вариант № 13
- •Вариант № 14
- •Вариант № 15
- •Вариант № 16
- •Вариант № 17
- •Вариант № 18
- •Вариант № 19
- •Вариант № 20
- •Вариант № 21
- •Вариант № 22
- •Вариант № 23
- •Вариант № 24
- •Вариант № 25
- •Вариант № 26
- •Вариант № 27
- •Вариант № 28
- •Вариант № 29
- •Вариант № 30
- •8. Контрольные задания по статистике для студентов дневной формы обучения
- •Основные вопросы теории математической статистики
- •Типы отборов и виды выборок.
- •8.2 Варианты контрольных работ Вариант № 1
- •Вариант № 2
- •Вариант № 3
- •Вариант № 4
- •Вариант № 5
- •Вариант № 6
- •Вариант № 7
- •Вариант № 8
- •Вариант № 9
- •Вариант № 10
- •Семестровые задания по статистике
- •9.1 Условие семестрового задания для студентов дневной формы обучения
- •9.2 Условие контрольной работы по статистике для студентов заочной формы обучения
- •9.3 Варианты заданий вариант 1
- •Вариант 2
- •Вариант 3
- •Пример выполнения контрольной работы по статистике для студентов заочной формы обучения
- •Выборочное среднее квадратическое отклонение равно
- •Выборочное среднее квадратическое отклонение равно
- •Приложения !!!! в отдельном файле “ Приложения” Рекомендуемая литература
6.2 Пакет программ statistica
Пакет STATISTICA фирмы StatSoft является интегрированной системой статистического анализа и обработки данных. Он позволяет проводить статистическую обработку данных в широком спектре на высоком профессиональном уровне, но при этом выдвигаются достаточно большие требования к пользователю в отношении теоретической подготовки в области математической статистики. Хотя и новички в статистике смогут выполнить, и, главное, интерпретировать некоторые статистические операции.
STATISTICA состоит из следующих компонент, которые объединены в рамках одной системы:
электронных таблиц для ввода, хранения и изменения данных (Spreadsheet);
электронных таблиц для вывода результатов статистического анализа (Scrooldsheet);
мощной графической системы;
набора специализированных статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;
специального инструментария для подготовки отчетов;
встроенных языков программирования.
После запуска программы появляется пустая электронная таблица в STATISTICA File Server. Затем вводят данные в таблицу; заменяют стандартные названия переменных на требуемые; изменяют формат данных. Здесь же можно выполнить некоторые действия над данными: визуализация данных, основные статистические характеристики данных. Для более сложных действий применяют специализированные модули. Для запуска их требуется выбрать на панели инструментов Module Switcher - Переключатель модулей. Опишем основные статистические модули и их возможности.
Basic Statistics – Модуль Основные статистики и таблицы
Этот модуль включает в себя практически все описательные статистики, группировки, доверительные интервалы; тесты на нормальный закон распределения; расчет корреляционных матриц (размеров до 300 на 300); тесты на независимость признаков; гистограммы; таблицы частот.
Nonparametrics / Distrib. – Модуль Непараметрические статистики и подгонка распределений
Модуль содержит обширный набор непараметрических критериев согласия, в частности, критерий Колмогорова-Смирнова; ранговые критерии Манна-Уитни, Вилкоксона и многие другие.
Модуль позволяет подобрать к исходным данным подходящий закон распределения (13 наиболее известных видов).
Multiply Regression – Модуль Множественная регрессия
В этом модуле строятся зависимости между многомерными переменными; проверяется адекватность моделей; оцениваются и строятся остатки, исследуются мобели на наличие автокорреляции.
Nonlinear Estimation – Модуль Нелинейное оценивание
Этот модуль незаменим, если пользователю требуется составить нелинейное уравнение регрессии, проверить его на адекватность, рассчитать тесноту связи зависимого и независимых факторов.
Перечислим остальные модули:
Time series / Forecasting – Модуль Анализ временных рядов и прогнозирование
Cluster Analysis – Модуль Кластерный анализ
Process Analysis – –Модуль Анализ процессов
Canonical Analysis – Модуль Канонический анализ
Discriminant Function Analysis – Модуль Дискриминантный анализ
Factor Analysis –Модуль Факторный анализ
ANOVA/MANOVA – Модуль дисперсионного анализа
Classification Trees – Модуль Классификационное дерево
Data Management – Модуль Управление данными
Quality Control –Модуль Контроль качества
Более подробная информация о работе с данными в среде STATISTICA содержится в [3 ]
Для примера возьмем задачу о нахождении уравнения множественной регрессии, которая решалась нами средствами пакета Mathcad в пункте 5.8 и в среде Excel в пункте 6.1.
а) Заполняем данными исходную таблицу ( приводим фрагмент таблицы):
б) Используя переключатель модулей, переходим в модуль Множественная регрессия.
Выбираем зависимые (dependent -У) и независимые (independent X1, X2) переменные (variables). После нажатия кнопки ОК результаты можно вывести в виде таблицы
Regression Summary for Dependent Variable: Y (yyy.sta) |
||||||
R= ,78210169 RІ= ,61168305 Adjusted RІ= ,56599870 |
||||||
F(2,17)=13,389 p<,00032 Std.Error of estimate: 7,3732 |
||||||
|
|
St. Err. |
|
St. Err. |
|
|
|
BETA |
of BETA |
B |
of B |
t(17) |
p-level |
Своб.член |
|
|
10,986 |
12,145 |
0,905 |
0,378 |
X1 |
0,454 |
0,163 |
23,471 |
8,412 |
2,790 |
0,013 |
X2 |
-0,490 |
0,163 |
-0,018 |
0,006 |
-3,007 |
0,008 |
Здесь R=0,782 – корреляционное отношение; RI=0,612 – коэффициент детерминации; F(2,17)=13,389 – наблюдаемое значение критерия Фишера; p<0,00032 – значимость ошибки первого рода, при которой гипотезу об адекватности полученной модели нужно отвергнуть. Малая вероятность говорит о том, что модель адекватная.
Параметры модели содержатся в столбце В. Они совпадают с найденными ранее. В следующих столбцах помещены СКО этих параметров; их t-статистики и уровни вероятностей ошибок. Если выбрать значимость =0,1 , то коэффициенты регрессии при Х1 и Х2 признаются значимыми, свободный член уравнения регрессии признается незначимым. Это значит, что нужно выбрать другую спецификацию модели, возможно без свободного члена.