- •Раздел IV. Модель линейной парной регрессии 83
- •Раздел V. Множественная линейная регрессия 95 раздел I. Основные понятия теории вероятностей § 1. Элементы комбинаторики
- •§ 2. Классическое определение вероятности
- •§ 3. Теоремы сложения и произведения вероятностей
- •§ 4. Формулы полной вероятности и Байеса
- •§ 5. Схема испытаний Бернулли
- •Раздел II. Случайные величины § 1. Дискретные случайные величины
- •§ 2 Числовые характеристики дискретной случайной величины
- •§ 3. Непрерывные случайные величины
- •Из определения следует, что
- •Раздел III. Элементы математической статистики § 1. Генеральная и выборочная совокупности
- •§ 2. Выборочные характеристики
- •Точечные оценки
- •Генерирование случайных значений в Excel
- •Получение числовых характеристик средствами Excel
- •Проверка статистических гипотез
- •Испытание гипотез на основе выборочной средней
- •Испытание гипотез о двух генеральных дисперсиях
- •Ковариация и корреляция
- •Раздел IV. Модель линейной парной регрессии
- •Анализ вариации зависимой переменной
- •Предсказания и прогнозы на основе линейной модели регрессии
- •Испытание гипотезы для оценки линейности связи
- •Раздел V. Множественная линейная регрессия
Получение числовых характеристик средствами Excel
Медиану можно найти с помощью функции Excel МЕДИАНА(диапазон).
Моду можно найти с помощью функции Excel МОДА(диапазон).
Среднюю арифметическую величину можно найти с помощью Excel СРЗНАЧ(диапазон).
Дисперсию можно найти с помощью Excel ДИСПР(диапазон).
Кроме этого, для получения статистических данных можно использовать Сервис/Анализ данных/Описательная статистика.
Для этого выбираем пункт меню Сервис/Анализ данных/Описательная статистика и заполняем поля диалогового окна:
В Excel 2007 этот режим находится в блоке Данные/Анализ данных/Описательная статистика.
Если в меню Сервис (или Данные для Excel 2007) нет пункта Анализ данных, то надо его включить в пункте меню Сервис\Надстройки
В Excel 2007 для включения пакета анализа надо нажать перейти в блок Параметры Excel, нажав кнопку в левом верхнем углу, а затем кнопку «Параметры Excel» внизу окна:
Далее в открывшемся списке нужно выбрать Надстройки, затем установить курсор на пункт Пакет анализа, нажать кнопку Перейти и в следующем окне включить пакет анализа.
Проверка статистических гипотез
Очень часто генеральная совокупность должна подчиняться некоторым параметрам. Например, фасовочная машина должна наполнять пакеты сахаром по 1 кг. Как узнать, действительно ли генеральная совокупность подчиняется этим ограничениям? С этой целью проводят испытание гипотез.
Статистической гипотезой H называется предположение относительно параметров или вида распределения случайной величины.
Нулевой (основной) называют выдвинутую гипотезу H0, а конкурирующей (альтернативной) — гипотезу Н1, которая противоречит нулевой. Основная гипотеза H0 это утверждение, которое подлежит проверке.
Например,
гипотеза H0:
генеральная средняя
.
Альтернативная гипотеза H1
в
этом примере может быть сформулирована
любым из следующих способов:
H1:
(правосторонняя проверка);H1:
(левосторонняя проверка);H1:
(двусторонняя проверка).
Проверку статистической гипотезы выполняют на основе результатов выборки. Поскольку выборка имеет ограниченный объем, то появляется возможность принятия ошибочного решения.
Вероятность того, что будет отвергнута правильная нулевая гипотеза, называется уровнем значимости.
Выбор, например, 5%-го уровня значимости означает, что в пяти случаях из ста верная гипотеза будет отвергнута. Стремление к уменьшению ведет в то же время к уменьшению вероятности отвергнуть гипотезу, когда она является ложной.
Статистическим критерием называется случайная величина, которая служит для проверки нулевой гипотезы. В качестве статистического критерия выбирается такая случайная величина, например t, точное или приближенное распределение которой известно.
Наблюдаемым значением t (статистикой) называется значение критерия, вычисленное по данным выборки. Формула для вычисления статистики зависит от вида решаемой задачи.
Множество значений критерия t разбивают на две непересекающиеся области: критическую и область принятия гипотезы.
Критической областью называется совокупность значений критерия, при которых гипотеза H0 отвергается. Различают одностороннюю и многостороннюю критические области.
Областью принятия гипотезы называется совокупность значений критерия, при которых гипотеза H0 принимается.
Критическими точками tкр называются точки, отделяющие критическую область и область принятия гипотезы. Критические точки tкр определяются по таблицам известного распределения выбранного критерия t при заданном уровне значимости и числе степеней свободы.
Сравнивая наблюдаемое значение критерия с критическими точками, можно принять или отвергнуть нулевую гипотезу.
Значения статистики и граничных точек наносят на координатную ось. В зависимости от их взаимного расположения возможен один из трех вариантов:
принимается H0;
принимается H0 и без всякой проверки принимается H1;
доказательство является неубедительным, нужно больше данных.
Д
ля
левосторонней проверки:
Д
ля
правосторонней проверки:
Д
ля
двусторонней проверки:
