- •1. Выборка. Основные характеристики.
- •1. 1. Способы первичной обработки выборки
- •1. 2. Полигон частот. Выборочная функция распределения и гистограмма
- •1.3. Статистические оценки параметров
- •1. Доверительный интервал для оценки математического ожидания
- •2. Доверительный интервал для оценки математического ожидания
- •3. Доверительные интервалы для оценки среднего квадратического
- •4. Интервальное оценивание генеральной доли (вероятности события).
- •2. Элементы теории корреляции
- •2.1. Линейная корреляция
- •2.2. Определение параметров функциональной зависимости
- •3. Статистическая проверка гипотез
- •3.1. Основные понятия.
- •3.2. Критерий для проверки гипотезы
- •3.3. Сравнение двух вероятностей
- •3.4. Критерий для проверки гипотезы о математическом ожидании.
- •3.5. Сравнение двух средних генеральных совокупностей
- •3.6. Критерий для проверки гипотезы о сравнении двух дисперсий.
- •3.7. Приближенный метод проверки нормальности распределения,
- •3.8.Проверка гипотезы о генеральной доле
- •3.9. Проверка гипотезы о значимости выборочного
- •3.10. Критерий Пирсона для проверки гипотезы о виде закона распределения случайной величины. Критерий Колмогорова.
- •Критерий Пирсона.
- •3.11. Проверка гипотезы о равенстве нулю генерального
- •4. Применение в математической статистике
1. 2. Полигон частот. Выборочная функция распределения и гистограмма
Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x1, n1), (x2, n2),…, (xk, nk), где xi откладываются на оси абсцисс, а ni – на оси ординат. Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот (рис.1). Рис. 1.
В теории вероятностей для характеристики распределения случайной величины служит функция распределения
,
равная вероятности события , где – любое действительное число.
Одной из основных характеристик выборки является выборочная (эмпирическая) функция распределения
,
где – количество элементов выборки, меньших чем . Другими словами, есть относительная частота появления события в независимых испытаниях. Главное различие между и состоит в том, что определяет вероятность события , а выборочная функция распределения – относительную частоту этого события.
Из определения имеем следующие свойства функции :
1. .
2.– неубывающая функция.
3.
Напоминаем, что такими же свойствами обладает и функция распределения (вспомните эти свойства и сравните).
Функция является "ступенчатой", имеются разрывы в точках, которым соответствуют наблюдаемые значения вариантов. Величина скачка равна относительной частоте варианта.
Аналитически задается следующим соотношением:
где – соответствующие относительные частоты; – элементы вариационного ряда (варианты).
Замечание. В случае интервального вариационного ряда под понимается середина i-го частичного интервала.
Перед вычислением полезно построить дискретный или интервальный вариационный ряд.
Пример. Построить выборочную функцию распределения по наблюдаемым данным, приведенным в примере 2.1.
Решение. Используя соответствующий этим данным дискретный вариационный ряд (см. табл. 2.1), вычислим значения и занесем их в табл. 2.3.
Таблица 2.3
x |
|
x 1 |
0 |
0 < x 1 |
|
1 < x 2 |
|
2 < x 3 |
|
3 < x 4 |
|
4 < x 5 |
|
5 < x 7 |
|
x > 7 |
Из графика (рис. 2.1) видно, что удовлетворяет свойствам функции .
Напомним, что равна относительной частоте появления события и, следовательно, при любом значении величина является случайной. Тогда конкретной выборке объема соответствует функция распределения , которая в силу своей случайности будет отличаться от , построенной по другой выборке из той же генеральной совокупности.
Рис. 2.1. График выборочной функции распределения (пример 2.4)
По аналогии с функцией распределения случайной величины можно задать некоторую функцию, относительную частоту события X < x.
В качестве оценки плотности распределения вероятности непрерывной случайной величины используют гистограмму относительных частот.
Гистограммой относительных частот называется система прямоугольников, каждый из которых основанием имеет i-й интервал интервального вариационного ряда; площадь, равную относительной частоте , а высота определяется по формуле
,
где – длина i-го частичного интервала. Если длина частичных интервалов одинакова, то .
Очевидно, что сумма площадей всех прямоугольников равна 1.
График плотности распределения генеральной совокупности проходит вблизи верхних границ прямоугольников, образующих гистограмму. Поэтому при больших объемах выборок и удачном выборе длины частичных интервалов гистограмма напоминает график плотности распределения .
Пример 2.5. Построим гистограмму относительных частот выборочной совокупности из примера 2.3.
Решение. Используя интервальный вариационный ряд (см. табл. 2.2), находим высоты по формуле . График построенной гистограммы приведен на рис. 2.2. Здесь же штриховой линией отмечен предполагаемый график неизвестной плотности .
0.10
0.05
Рис. 2.2. График гистограммы частностей (пример 2.5)
Для непрерывного признака графической иллюстрацией служит гистограмма, то есть ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотами – отрезки длиной ni /h (гистограмма частот) или wi /h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором –
единице. Рис.2.
Пример. Дана выборка, вариационный ряд которой имеет вид:
10,8; 11,1; 11,7; 12,2; 13,1; 13,4; 13,9; 14,3; 14,3; 14,4; 14,8; 16,5; 17,7; 18,2; 19,9; 20,0; 20,3; 20,8; 23,1; 24,2; 25,1; 25,1; 25,7; 28,4; 28,5; 29,3; 29,8; 29,9; 30,2; 30,4.
Составить статистический ряд распределения абсолютных и относительных частот, состоящий из пяти интервалов, и построить гистограмму относительных частот.
Объем выборки п = 30. Выберем в качестве границ интервала а = 10,5 и b = 30,5. Тогда и (a, b) разбивается на части (10,5; 14,5), (14,5; 18,5), (18,5; 22,5), (22,5; 26,5) и (26,5; 30,5). Статистический ряд при этом имеет вид:
Номер интервала |
Границы интервала |
Абсолютные частоты |
Относительные частоты |
1 |
10,5; 14,5 |
10 |
|
2 |
14,5; 18,5 |
4 |
|
3 |
18,5; 22,5 |
4 |
|
4 |
22,5; 26,5 |
5 |
|
5 |
26,5; 30,5 |
7 |
|
Построим гистограмму:
x ◄
Пример. Выборочно обследовано 26 предприятий лёгкой промышленности по валовой продукции. Получены следующие результаты в млн. руб.: 15,0; 16,4; 17,8; 18,0; 18,4; 19,2; 19,8; 20,2; 20,6; 20,6; 20,6; 21,3; 21,4; 21,7; 22,0; 22,2; 22,3; 22,7; 23,0; 24,2; 24,2; 25,1; 25,3; 26,0; 26,5; 27,1. Составить интервальное распределение выборки с началом х1=15 и длинами частичных интервалов h=2,5. Построить гистограмму частот.
Для составления интервального распределения составим таблицу. В первой строке расположим в порядке возрастания интервалы, длина каждого из которых h=2,5. Во второй строке запишем количество значений признака в выборке, попавших в этот интервал (т.е. сумму частот вариант, попавших в соответствующий интервал). Интервальный статистический ряд таков:
(xi, xi+1) |
15–17,5 |
17,5–20 |
20–22,5 |
22,5–25 |
25–27,5 |
ni |
2 |
5 |
10 |
4 |
5 |
Объем выборки n=2+5+10+4+5=26. Для построения гистограммы частот на оси абсцисс откладываем частичные интервалы; на каждом из них строим прямоугольники высотой
10/2,5
5/2,5
2/2,5
хi – xi+1
15 17,5 20 22,5 25 27,5
Площадь каждого прямоугольника равна частоте интервала, на котором он построен. Сумма площадей этих прямоугольников равна объёму выборки. ◄
Вопросы для самопроверки
1. Что понимается под генеральной совокупностью?
2. Что такое выборка, размах выборки, объем выборки? Как обеспечивается представительность ее?
3. Объясните, как получают повторную и бесповторную выборки?
4. Что называют ошибкой репрезентативности?
5. Что такое частота появления варианты в выборке?
6. Как получают относительную частоту варианты в выборке?
7. Объясните, как получают вариационный ряд, статистический ряд распределения.
8. Что мы называем функцией распределения и статистической функцией распределения?
Какими свойствами обладает статистическая функция распределения?
9. Дайте определение группированного статистического ряда. Как строится гистограмма?
10. Что такое гамма-функция?
11. Запишите формулы плотности распределения для нормального, и распределения Стьюдента.
12. Как выполняется чертеж многоугольника распределения относительных частот?
13. Как выполняется чертеж гистограммы распределения плотности относительных частот?