- •Содержание
- •Введение
- •РазделI. Статистические методы обработки данных
- •Глава 1. Вариационные ряды и их характеристики
- •1.1. Первичная обработка результатов наблюдений
- •1.2. Графическое представление статистических данных
- •1.3. Расчет выборочных характеристик статистического распределения
- •1.4. Интервальные (доверительные) оценки параметров распределения
- •Контрольные вопросы
- •Глава 2. Проверка статистических гипотез
- •2.1. Построение кривой нормального распределения
- •2.2. Классический метод проверки гипотез
- •2.3. Проверка гипотез о законе распределения
- •Критерий Пирсона
- •Критерий Колмогорова
- •Контрольные вопросы
- •Глава 3. Парная регрессия и корреляция
- •3.1. Понятие функциональной, статистической и корреляционной зависимости
- •3.2. Линейная модель парной регрессии и корреляции
- •3.3. Нелинейные модели парной регрессии и корреляции
- •Контрольные вопросы
- •Глава 4. Множественная регрессия и корреляция
- •4.1.Спецификация модели. Отбор факторов при построении уравнения множественной регрессии
- •4.2. Метод наименьших квадратов (мнк). Свойства оценок на основе мнк
- •4.3. Проверка существенности факторов и показатели качества регрессии
- •Контрольные вопросы
- •Раздел II. Лабораторный практикум
- •Выполнение работы
- •Лабораторная работа № 2. Построение модели линейной регрессии (случай несгруппированных данных)
- •Выполнение работы
- •Лабораторная работа № 3. Построение уравнения модели линейной регрессии (случай сгруппированных данных)
- •Выполнение работы
- •Лабораторная работа № 4. Изучение модели нелинейной регрессии
- •Выполнение работы
- •Лабораторная работа № 5. Построение модели множественной регрессии
- •Выполнение работы
- •Лабораторная работа № 6. Прогнозирование. Анализ аддитивной модели
- •Выполнение работы
- •Варианты индивидуальных заданий Варианты заданий к лабораторной работе № 1.
- •Варианты заданий к лабораторной работе № 2.
- •Варианты заданий по лабораторной работе № 3
- •Варианты заданий по лабораторной работе № 4
- •Варианты заданий к лабораторной работе № 5.
- •Варианты заданий к лабораторной работе № 6.
- •Тестовые задания
- •Список литературы
- •Приложения
- •Статистические методы обработки данных
- •Библиотечно-издательский комплекс
- •625000, Тюмень, ул. Володарского, 38. Типография библиотечно-издательского комплекса.
- •625039, Тюмень, ул. Киевская, 52.
Глава 2. Проверка статистических гипотез
Любое высказывание о генеральной совокупности (случайной величине), которое проверяется по результатам наблюдений (по выборке), называется статистической гипотезой.
Примерами статистических гипотез могут быть:
- математическое ожидание случайной величины равно конкретному числовому значению;
- генеральная совокупность распределена по нормальному закону.
Гипотезы бывают двух видов: параметрические (гипотезы о параметрах распределения известного вида) и непараметрические (гипотезы о виде неизвестного распределения).
При этом принято различать простые гипотезы, содержащие только одно предположение, и сложные, которые содержат два и более предположения.
Например,
гипотеза
является простой, а гипотеза
:
,
( где
)
– сложной, потому что данная гипотеза
состоит из бесконечного множества
простых гипотез.
Процедуру сопоставления гипотезы с выборочными данными называют проверкой гипотезы. При этом используются аналитические и статистические методы.
2.1. Построение кривой нормального распределения
Проверку соответствия опытных данных предполагаемому закону распределения в первом приближении можно осуществить графическим методом. Опытные данные наносят на вероятностную бумагу и сравнивают с графиком принятой функции распределения, которая на вероятностной сетке изображается прямой линией. Если экспериментальные точки ложатся вблизи прямой со случайными отклонениями вправо или влево, то опытные данные соответствуют рассматриваемому закону распределения. Систематическое и значительное отклонения экспериментальных точек от аппроксимирующей прямой свидетельствует о несоответствии данной выборки предполагаемому закону распределения.
Возможен другой вариант применения графического метода для проверки соответствия опытных данных предполагаемому закону распределения.
Пусть
требуется определить соответствие
опытных данных нормальному закону
распределения. С этой целью за основу
берут дискретный вариационный ряд и в
системе координат строят эмпирическую
кривую распределения – полигон частот.
Затем в этой же системе координат строят
точки с координатами (
;
),
через которые проводят теоретическую
кривую нормального распределения.
Для нахождения теоретических частот составляется табл. 1.7.
Таблица 1.7
|
|
|
|
(ui) |
|
|
|
|
|
|
|
|
|
где – варианты дискретного вариационного ряда,
– частоты вариант ,
–
выборочная средняя,
– выборочное среднее квадратическое отклонение,
– шаг (разность между соседними вариантами),
–
функция, значения
которой находят по приложению 3,
–
выровненные частоты
(ординаты) теоретической кривой,
– округленные частоты до ближайшего целого числа.
Рис.1.6. График кривой нормального распределения
2.2. Классический метод проверки гипотез
При
использовании классического метода
проверки гипотез в соответствии с
поставленной задачей и на основании
выборочных данных выдвигается гипотеза
,
называемая нулевой гипотезой.
Одновременно с выдвинутой гипотезой
,
рассматривают противоположную ей
гипотезу
,
называемую альтернативной.
Для
проверки нулевой гипотезы необходимо
ввести специально подобранную случайную
величину
,
распределение которой известно и
называется ее критерием. Вследствие
того, что для генеральной совокупности
гипотеза
принимается по выборочным данным, то
она может быть ошибочной. При этом
различают следующие ошибки.
Ошибка
первого рода - заключается в том, что
гипотезу
отвергают,
когда она на самом деле верна. Для
определения вероятности ошибки первого
рода вводят параметр
,
т.е. вероятностью того, что будет принята
альтернативная гипотеза
,
при условии, что гипотеза
верна. Величину
называется уровнем значимости,
который выбирается, как правило, в
пределах от 0,001 до 0,1.
Ошибка второго рода заключается в том, что отвергают альтернативную гипотезу , когда она на самом деле верна.
Вероятность
ошибки второго рода определяется
параметром
,
т.е. вероятностью того, что будет принята
гипотеза
,
при условии, что альтернативная гипотеза
верна. Величину
,
то есть недопустимость ошибки второго
рода, принято называть мощностью
критерия.
Множество
всех значений критерия разбивают на
два непересекающихся подмножества:
одно из них содержит значения критерия,
при которых нулевая гипотеза
отвергается; другое – при которых она
принимается. При этом совокупность
значений критерия, при которых нулевая
гипотеза отвергается, принято называть
критической областью
.
Совокупность значений критерия, при которых принимают нулевую гипотезу,называют областью принятия гипотезы или областью допустимых значений.
Гипотеза
отвергается и принимается альтернативная
гипотеза
в том случае, когда вычисленное по
выборке значение критерия
попадает в критическую область
.
В данном случае может быть совершена
ошибка первого рода, вероятность которой
равна
.
Иначе, вероятность того, что критерий
примет значение из критической области
,
должна быть равна заданному значению
,
то есть
.
Возможны три случая расположения критической области , которые определяются видом нулевой и альтернативной гипотез и законом распределения критерия .
Первый
случай: критическая область правосторонняя
(рис.1.5 а), состоящая из интервала
,
где
определяется из условия
и называется правосторонней точкой,
отвечающей уровню значимости
.
Рис. 1.5. Виды критической области
Второй
случай: критическая область - левосторонняя
(рис. 1.5 б), которая состоит из интервала
,
где
определяется из условия
,
и называется левосторонней точкой,
отвечающей уровню значимости
.
Третий
случай: критическая область - двусторонняя
(рис. 1.5 в), которая состоит из двух
интервалов:
и
,
где точки
и
определяются из условий
и
и называют двусторонними критическими
точками.
Проверка нулевой гипотезы осуществляется по следующему алгоритму:
Формулируется нулевая и альтернативная гипотезы по располагаемой выборке.
Выбирается критерий проверки гипотезы , которая зависит от выборочных данных и условия рассматриваемой задачи. Наиболее часто используются случайные величины, имеющие такие законы распределения как нормальный, Стъюдента, Фишера-Снедекора, хи-квадрат.
Задается уровень значимости выбранного критерия и определяется соответствующая ему критическая область. Для определения критической области находят критическую точку
- ее границу. Для каждого критерия
имеются таблицы, по которым и находят
критическую точку.Вычисляют значение критерия по результатам произведенных измерений и сравнивают с критической точкой.
Нулевая гипотеза отвергается в случае, когда вычисленное значение критерия попадает в границы критической области, или ее считают справедливой в случае, когда значение критерия оказывается внутри области допустимых значений.
