- •Раздел IV. Модель линейной парной регрессии 83
- •Раздел V. Множественная линейная регрессия 95 раздел I. Основные понятия теории вероятностей § 1. Элементы комбинаторики
- •§ 2. Классическое определение вероятности
- •§ 3. Теоремы сложения и произведения вероятностей
- •§ 4. Формулы полной вероятности и Байеса
- •§ 5. Схема испытаний Бернулли
- •Раздел II. Случайные величины § 1. Дискретные случайные величины
- •§ 2 Числовые характеристики дискретной случайной величины
- •§ 3. Непрерывные случайные величины
- •Из определения следует, что
- •Раздел III. Элементы математической статистики § 1. Генеральная и выборочная совокупности
- •§ 2. Выборочные характеристики
- •Точечные оценки
- •Генерирование случайных значений в Excel
- •Получение числовых характеристик средствами Excel
- •Проверка статистических гипотез
- •Испытание гипотез на основе выборочной средней
- •Испытание гипотез о двух генеральных дисперсиях
- •Ковариация и корреляция
- •Раздел IV. Модель линейной парной регрессии
- •Анализ вариации зависимой переменной
- •Предсказания и прогнозы на основе линейной модели регрессии
- •Испытание гипотезы для оценки линейности связи
- •Раздел V. Множественная линейная регрессия
Раздел III. Элементы математической статистики § 1. Генеральная и выборочная совокупности
Математическая статистика изучает методы систематизации обработки статистических данных. Задачи математической статистики:
указать способы сбора и группировки статистических данных;
разработать методы анализа статистических данных.
Пусть необходимо исследовать некоторую совокупность объектов. Если она слишком многочисленна, либо её элементы малодоступны, либо имеются другие причины, не позволяющие изучить сразу все элементы, то из неё выбирают некоторое количество объектов для изучения. При этом первоначальное множество объектов называют генеральной совокупностью, а ряд случайно отобранных объектов – выборочной совокупностью или выборкой.
Требования, которым должна удовлетворять выборка:
репрезентативность, т.е. выборка должна правильно представлять генеральную совокупность (пропорции в выборки должны быть такими как в генеральной совокупности);
количество объектов должно быть достаточно большим;
выборка должна быть случайной, т.е. каждый элемент генеральной совокупности должен иметь одинаковую вероятность попасть в выборку.
Введем ряд необходимых нам понятий.
Пусть обследуется признак Х некоторой генеральной совокупности получена выборка х1, х2,…, хn, где хi – значение признака, причем эти значения могут повторяться. Пусть ni – количество повторений признака хi. Числа хi называют вариантами, а числа ni – частотами. Объёмом выборки называется количество элементов в выборке. Отсюда,
,
где n
– объём выборки.
Отношение
называется
относительной
частотой
выборки или частостью
и обозначается pi,
т.е.
.
Очевидно, что
Вариационным рядом называется перечень вариантов соответствующих им частот, причем варианты располагаются в порядке возрастания. Операция по расположению значений признака в порядке их возрастания называется ранжированием.
В общем виде вариационный ряд записывается следующим образом:
Иногда вместо перечня значений xi задают интервалы, в которые попадают элементы выборки, в качестве частоты, соответствующей интервалу принимают сумму частот вариантов, попадавших в этот интервал. Интервалы также располагают в порядке возрастания. Такой ряд называют интервальным.
В общем виде интервальный ряд записывается следующим образом:
Рекомендуется количество интервалов k выбирать по формуле Стерджеса:
.
Длина интервала определяется по формуле
.
Пример.
Пусть в результате исследования некоторой выборки появились следующие значения признака Х: 5, 2, 2, 16, 2, 5, 21, 21, 5, 18, 5, 21. Провести ранжирование, построить вариационный и интервальный ряды.
Решение. Сгруппируем значения признака: 2, 2, 2; 5, 5, 5, 5; 16; 18; 21, 21, 21. Вариационный ряд будет следующим:
|
2 |
5 |
16 |
18 |
21 |
|
3 |
4 |
1 |
1 |
3 |
Для
построения интервального ряда, вычислим
объем выборки n,
количество интервалов k,
длину одного интервала :
,
,
.
Получаем интервальный ряд:
|
[2; 6) |
[6; 10) |
[10; 14) |
[14; 18) |
[18; 22) |
|
7 |
0 |
0 |
1 |
4 |
Данные, собранные в таблицу часто трудно воспринимать, они нуждаются в наглядном представлении. Для этого используются различные формы геометрического изображения: полигон, гистограмма, кумулянта.
Полигон
служит для изображения вариационного
и интервального ряда и представляет
собой ломаную, соединяющую точки
плоскости с координатами
.
Для интервального ряда в качестве
координат
берут середины интервалов.
Гистограмма
служит только для представления
интервального ряда и имеет вид ступенчатой
фигуры, составленной из прямоугольников
с основаниями, равными длине интервалов,
и высотами, равными значениям
.
Кумулянта
служит для изображения вариационного
и интервального ряда и представляет
собой ломаную, соединяющую точки с
координатами
,
где
накопленные частоты. Для интервального
ряда в качестве координат
берут середины интервалов.
Пример.
Построить полигон, гистограмму и кумулянту по вариационному и интервальному ряду из примера 1.
Решение.
Полигон для вариационного ряда
|
2 |
5 |
16 |
18 |
21 |
|
3 |
4 |
1 |
1 |
3 |
Полигон для интервального ряда
|
[2; 6) |
[6; 10) |
[10; 14) |
[14; 18) |
[18; 22) |
|
7 |
0 |
0 |
1 |
4 |
Гистограмма для интервального ряда:
Кумулянта для вариационного ряда:
Кумулянта для интервального ряда:
