
- •С.Е.Игнатова математическая статистика
- •Санкт-Петербург
- •Утверждено редакционно-издательским советом сПбГиэу
- •Игнатова с.Е.
- •Содержание:
- •Предисловие
- •Введение
- •1.Генеральная совокупность, выборка и основные способы организации выборки.
- •2.Вариационный ряд и порядковые статистики.
- •3.Статистическое оценивание параметров.
- •4.Точечные оценки и их свойства (несмещенность, состоятельность и эффективность).
- •5.Основные выборочные характеристики и их свойства.
- •5.1.Генеральная и выборочная средние.
- •5.2.Групповая и общая средние.
- •5.3.Отклонение от общей средней и его свойство.
- •5.4.Генеральная и выборочная дисперсии.
- •5.5.Групповая, внутригрупповая, межгрупповая и общая дисперсии.
- •5.6.Сложение дисперсий.
- •6.Основные точечные оценки.
- •6.1.Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних.
- •6.2.Оценка генеральной дисперсии по исправленной выборочной.
- •7.Законы распределения выборочных характеристик в нормальной генеральной совокупности.
- •7.1.Число степеней свободы.
- •7.2.Распределение хи-квадрат.
- •7.3.Распределение Стьюдента.
- •7.4.Распределение Фишера-Снедекора.
- •8.Интервальные оценки и доверительные области.
- •8.1.Оценка вероятности (биноминального распределения) по относительной частоте.
- •8.2.Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении.
- •8.3.Доверительный интервал для оценки среднего квадратического отклонения нормального распределения.
- •9.Байесовское статистическое оценивание.
- •10.Статистическая проверка гипотез: основные типы гипотез и общая логическая схема статистического критерия; характеристики качества критерия.
- •10.1.Общая логическая схема статистического критерия
- •10.2.Характеристики качества критерия.
- •11.Критерии согласия и однородности, проверка гипотезы о числовых значениях параметров.
- •11.1.Критерий однородности.
- •Например, рассмотрим непараметрический критерий сдвига.
- •11.2.Критерий согласия.
- •11.3.Методика вычисления теоретических частот нормального распределения:
- •11.4.Пример обработки массива статистических данных.
- •11.5.Сравнение двух дисперсий нормальных генеральных совокупностей
- •12.Неравенство информации, метод максимального правдоподобия и метод моментов.
- •12.1.Метод максимального правдоподобия
- •12.2.Неравенство информации
- •12.3.Эмпирические моменты
- •12.4.Метод моментов.
- •13.Основы статистического исследования зависимостей.
- •13.1.Регрессионный анализ.
- •13.1.1.Отыскание параметров выборочного уравнения линейной регрессии по несгруппированным данным.
- •13.1.2.Выборочный коэффициент корреляции.
- •13.1.3.Корреляционная таблица.
- •13.1.4.Отыскание параметров выборочного уравнения линейной регрессии по сгруппированным данным.
- •13.1.5.Выборочное корреляционное отношение.
- •13.1.6.Свойства выборочного корреляционного отношения.
- •13.1.7.Простейшие случаи криволинейной корреляции.
- •13.1.8.Понятие о множественной корреляции.
- •13.2.Дисперсионный анализ.
- •13.2.1.Общая, факторная и остаточная суммы квадратов отклонений
- •13.2.2.Связь между общей, факторной и остаточной суммами.
- •13.2.3.Общая, факторная и остаточная дисперсии.
- •13.2.4.Сравнение нескольких средних методом дисперсионного анализа.
- •13.2.5.Неодинаковое число испытаний на различных уровнях фактора.
- •Заключение
- •Список литературы:
- •Сведения об авторе
2.Вариационный ряд и порядковые статистики.
Пусть из генеральной
совокупности извлечена выборка, причем
значение интересующего нас признака
х1
наблюдалось
n1
раз, х2
– n2
раз, …, хк
– nк
раз и
= n
– объем
выборки.
Определение: Наблюдаемые значения xi называют вариантами, а последовательность вариант, записанных в возрастающем порядке, – вариационным рядом. Числа наблюдений ni называют частотами, а их отношение к объему выборки wi – относительными частотами.
= wi
Определение: Статистическим распределением выборки называют перечень вариант и соответствующих им частот.
Пример: Дано статистическое распределение частот выборки обьема n = 20:
xi |
2 |
6 |
12 |
ni |
3 |
10 |
7 |
Написать распределение относительных частот.
Решение: Найдем
относительные частоты: w1
=
= 0,15;
w2
=
=
= 0,5; w3
=
= 0,35. Получаем искомое статистическое
распределение
относительных частот:
xi |
2 |
6 |
12 |
wi |
0,15 |
0,5 |
0,35 |
Варианты могут быть записаны в виде точечных значений или в виде интервалов (частичных интервалов) непрерывных значений. В первом случае вариационный ряд называется дискретным (точечным), во втором – интервальным. Для частичного интервала выбирают длину h, определяемую условиями задачи или рассчитывают по формуле:
При этом значение признака, находящегося на границе частичных интервалов обычно относят к правой границе частичного интервала.
На практике считается, что правильно составленный вариационный ряд содержит от 6 до 15 частичных интервалов.
Часто интервальный вариационный ряд заменяют дискретным вариационным рядом, выбирая средние значения (середины) интервалов.
Статистическое распределение выборки можно задать не только с помощью таблицы, но и аналитически – с помощью эмпирической функции распределения.
Определение: Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(х), определяющую для каждого значения х относительную частоту события X < x:
F*(х)
=
,
где nx – число вариант, меньших х, а n – объём выборки.
Заметим, что функцию распределения F(х) генеральной совокупности называют теоретической функцией распределения. F(х) определяет вероятность, т.е. P(X<x), а F*(х) – относительную частоту этого же события.
F*(х) обладает всеми свойствами F(x).
Пример: Построить эмпирическую функцию распределения по данному распределению выборки:
хi |
2 |
6 |
10 |
ni |
12 |
18 |
30 |
Решение. Объём выборки n = 12+18+30 = 60. Наименьшая варианта равна 2, следовательно F*(х) = 0 при x ≤ 2 .
Значение X
< 6, а именно х1
= 2,
наблюдалось 12 раз, следовательно, F*(х)
=
= 0,2 при 2 < X
≤ 6.
Значения X
< 10, а именно
х1
= 2 и х2
= 6 наблюдались
12+18= 30 раз, следовательно, F*(х)
=
=
0,5 при 6 < x
≤ 10.
Т. к. х = 10 – наибольшая варианта, то F*(х) = 1 при х > 10.
F*(х)=
0 при x
0,2 при 2 < х ≤ 6
0,5 при 6 < x ≤ 10
1 при x > 10.
Построим график этой функции. Он имеет ступенчатый вид:
F(x)
1
0,5
0,2
0 1 2 3 4 5 6 7 8 9 10 x
Статистическое распределение выборки можно задать и графически – с помощью полигона или гистограммы.
Определение: Полигоном частот называют ломанную, отрезки которой соединяют точки (х1; n1 ), (x2; n2), ... , (xk; nk).
Определение: Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (х1; w1), (x2; w2), …, (xk; wk).
W
w3
w4
w2
w1
x1 x2 x3 x4 X
В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длинной h и находят для каждого частичного интервала частоту ni – сумму частот вариант, попавших в данный i-ый интервал.
Определение:
Гистограммой
частот называется ступенчатая фигура,
состоящая из прямоугольников, основаниями
которых служат частичные интервалы
длиною h,
а высоты равны отношению
(плотность частоты).
Заметим, что площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.
h
=
= n
Пример: Статистическое распределение задано с помощью интервального вариационного ряда, частичные интервалы которого имеют длину h = 5.
Частичный интервал
|
Сумма частот вариант частичного интервала ni |
Плотность частоты
|
5-10 10-15 15-20 20-25 25-30 30-35 35-40 |
4 6 16 36 24 10 4 |
0,8 1,2 3,2 7,2 4,8 2 0,8 |
Построим
гистограмму частот:
7
,2
3
,2
0
,8
0 5 10 15 20 25 30 35 40 Х
Определение: Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны отношению wi / h (плотность относительной частоты).
Заметим, что площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.
h
=
=
1
Определение:
Модой
называют
варианту, которая имеет наибольшую
частоту.
Пример:
хi |
1 |
7 |
9 |
ni |
10 |
14 |
6 |
Очевидно, =7.
Определение:
Медианой
называют варианту, которая делит
вариационный ряд на две части, равные
по числу вариант.
Если число вариант
нечетно, т.е. n
= 2k+1,
то
=
.
Если число вариант
четно, т.е. n=2k,
то
=
.
Пример: Для
вариационного ряда 2, 3, 5, 6, 7
;
Для вариационного ряда 2, 3, 5, 6, 7, 9
=
5,5.
Определение: Размахом варьирования R называют разность между наибольшей и наименьшей вариантами:
R
=
Пример: Для ряда 1, 3, 4, 5, 6, 10 размах равен R = 10-1 = 9.
Размах является простейшей характеристикой рассеяния вариационного ряда.
Определение: Любую функцию случайной выборки называют статистикой.