
- •Работа № 1. Выборки и их представление Основные понятия
- •1. Выполнение в пакете statistica
- •2. Выполнение в пакете spss
- •Работа №2. Предельные теоремы.
- •Теорема Бернулли
- •1. Выполнение в пакете Statistica
- •2) Выполнение в пакете spss
- •1. Выполнение в пакете statistica
- •2. Выполнение в пакете spss
- •Сжатие распределения с ростом числа слагаемых.
- •1. Выполнение в пакете statistica
- •2. Выполнение в пакете spss
- •Усиленный закон больших чисел.
- •1. Выполнение в пакете statistica
- •2. Выполнение в пакете spss.
- •Теорема Гливенко основная теорема статистики
- •1. Выполнение в пакете statistica
- •2. Выполнение в пакете spss.
- •Центральная предельная теорема
- •Одинаково распределенные слагаемые.
- •1) Выполнение в пакете statistica
- •2. Выполнение в пакете spss.
- •Различно распределенные слагаемые
- •1. Выполнение в пакете statistica
- •2. Выполнение в пакете spss
- •Работа № 3. Оценки
- •Постановка конкретной задачи.
- •Теоретическое сравнение оценок
- •Статистическое сравнение оценок
- •Задание для самостоятельной работы
- •1. Выполнение в пакете statistica
- •2. Выполнение в пакете spss
- •Работа n4. Доверительные границы и интервалы
- •Определения и построение интервалов
- •Уровень доверия
- •Интервалы для параметров нормального распределения
- •Задание на самостоятельную работу
- •1. Выполнение в пакете statistica
- •2. Выполнение в пакете spss
- •Работа № 5. Критерий "хи-квадрат" проверки гипотез
- •Проверка простой гипотезы о вероятностях
- •Проверка сложной гипотезы о вероятностях
- •Проверка гипотезы о типе распределения
- •1. Выполнение в пакете statistica
- •Примеры проверки простой гипотезы о распределении
- •1. Выполнение в пакете statistica
- •Проверка гипотезы о независимости признаков (таблица сопряженности признаков)
- •1. Выполнение в пакете statistica
- •Проверка гипотезы об однородности выборок
- •1. Выполнение в пакете statistica
- •Задание
- •Работа № 6. Различение двух простых гипотез. Различение при фиксированном объеме наблюдений
- •Последовательное различение двух простых гипотез (последовательный анализ Вальда).
- •Задание
- •1. Выполнение в пакете staTiStica
- •Оценка вкладов. Если гипотеза ha отклоняется, следует оценить вклады aj уровней фактора; оценка
- •1. Выполнение в пакете statistica
- •Работа № 8. Линейный регрессионный анализ
- •1. 1. Простая линейная регрессия
- •2.2. Множественная регрессия
- •3. 3. Нелинейная зависимость
- •4.4. Нелинейная зависимость (обобщение)
- •Литература
2. Выполнение в пакете spss
Сгенерируем слагаемые с заданными в таблице параметрами в соответствии со следующими формулами (в порядке нумерации):
2, 2, , 1-
, , где R[0,1];
последнее, 6-е слагаемое, с параметрами a = b = 2 :
(1+ln(12) / ln(34))-1,
где 1, ..., 4 - независимые R[0,1] случайные величины. Проверкой можно убедиться в справедливости формул.
Убедимся по гистограммам в том, что все 6 слагаемых явно не нормальны. Убедимся в том, что сумма 6 слагаемых близка к нормальной случайной величине. Графики сохраним.
Выполним до конца задание 1. Выполним задание 2.
Работа № 3. Оценки
Пусть x1, ..., xn — выборка , т.е. n независимых испытаний случайной величины X , имеющeй функцию распределения F(x / a), зависящую от параметра a, значение которого неизвестно. требуется оценить значение параметра a.
Оценкой â = (x1, ..., xn) называется функция наблюдений, используемая для приближенного определения неизвестного параметра. Значение â оценки является случайной величиной, поскольку (x1, ..., xn) — случайная величина (многомерная).
Свойства оценок
1. Оценка â= (x1, ..., xn) называется состоятельной, если при n â a по вероятности при любом значении a.
2. Оценка â = (x1, ..., xn) называется несмещенной, если при любом a Mâ = M(x1, ..., xn) = a.
состоятельность - обязательное свойство используемых оценок. свойство несмещенности является желательным; многие применяемые оценки свойством несмещенности не обладают.
3. Оценка * называется оптимальной, если для неё средний квадрат ошибки
M(â- a)2= M[*(x1, ..., xn) - a]2= min M[(x1, ..., xn) - a]2
минимален среди всех оценок {}; здесь критерием качества оценки принят квадарт ошибки (â - a)2. В более общей ситуации, если критерием качества служит некоторая величина L(â, a), называемая функцией потерь (или функцией штрафа), то оптимальная оценка та, для которой минимальна величина ML(â, a); последняя есть функциея неизвестного a и называется функцией условного риска. Ясно, что оптимальной оценки может не существовать (так как характеристикой является функция, а не число).
Постановка конкретной задачи.
Пример. Пусть на заводе имеется большая партия из N (тысячи) транзисторов, используемых для сборки некоторого прибора. Выходные параметры прибора (например, надежность, уровень шума, вероятность выхода из режима и т.д.) зависят от обратных токов транзисторов; обратный ток у разных экземпляров различен, и потому можно считать его случайной величиной, причем, как известно технологам, распределённой равномерно в диапазоне от 0 до Imax, где Imax —порог отбраковки, установленный на заводе - изготовителе транзисторов. Следовательно, выходные параметры прибора определяются величиной Imax. Предположим, что по каким-либо причинам значение Imax производителю приборов неизвестно. Ясно, что в этом случае из партии нужно случайным выбором извлечь n (сравнительно немного: десятки) транзисторов, измерить их ток, и по измерениям оценить Imax (неизвестный параметр а). Таким образом, возникает
Статистическая задача: по наблюдениям x1, ..., xn над случайной величиной , распределённой равномерно на отрезке [0, a], оценить неизвестный параметр a.
сравним три способа оценивания (три оценки):
оценку, полученную методом моментов,
â1
=
,
(1)
оценку, полученную методом максимального правдоподобия (после исправления смещённости),
â2
=
max
xi
(2)
и оценку, полученную методом порядковых статистик,
â3
= 2
0.5
= x(k)
+ x(k+1),
(3)
где
0.5
=
—
выборочная квантиль порядка 0.5, т.е.
выборочная
медиана;
x(k)
—
член вариационного ряда с номером k;
здесь полагаем n
= 2k. Точность
этих оценок можно сравнить теоретически
и экспериментально (статистически).
Замечание. Точность, однако, не является единственным критерием качества оценок. Весьма важно, например, свойство устойчивости оценки к изменению закона распределения или к засорению; в этом смысле, как оказывается, â3 — наиболее хороша, а â2 — наименее; действительно, пусть, например, в нашу выборку случайно попало наблюдение, резко превосходящее все остальные (в случае с партией триодов, попался триод, не прошедший отбраковку); значение оценки â2 резко изменится, значение â3 почти не изменится.