- •1 Практическое занятие №1. Табличное и графическое представление экспериментальных данных.
- •Основные понятия и определения
- •1.2 Построение эмпирических функций распределения и плотности на примере
- •2 Практическое занятие №2. Вычисление характеристик эмпирических распределений (выборочных характеристик).
- •2.1 Основные понятия и определения
- •2.2 Вычисление выборочных характеристик на примере
- •Практическое занятие №3. Отсев грубых погрешностей.
- •3.1 Основные понятия и определения
- •3.2 Отсев грубых погрешностей на примере
- •4 Практическое занятие №4. Методики проверки гипотезы нормальности распределения.
- •4.1 Основные понятия и определения
- •4.2 Проверка гипотезы нормальности распределения по различным методикам
- •5 Практическое занятие №5. Метод наименьших квадратов.
- •Практическое занятие №6. Сравнение двух выборок.
- •6.1 Общие подходы к определению достоверности совпадений и различий характеристик экспериментальной и контрольной группы
- •Примеры определения достоверности совпадений и различий для экспериментальных данных по различным методикам
- •Для измерений используется шкала отношений.
1.2 Построение эмпирических функций распределения и плотности на примере
Пример: Дана выборка n=20 (Таблица 1.1). Построить графики эмпирических функций распределения и плотности.
Таблица 1.1 – Таблица значений выборки
№ значения выборки |
Значения выборки (х) |
№ значения выборки |
Значения выборки (х) |
1 |
9,81 |
11 |
6,72 |
2 |
2,34 |
12 |
5,15 |
3 |
6,55 |
13 |
0,34 |
4 |
0,15 |
14 |
2,23 |
5 |
8,63 |
15 |
4,85 |
6 |
7,11 |
16 |
5,01 |
7 |
1,57 |
17 |
4,15 |
8 |
2,34 |
18 |
1,11 |
9 |
5,55 |
19 |
2,48 |
10 |
0,99 |
20 |
4,44 |
Представим выборку в виде вариационного ряда, где Cn ≤ Cn+1:
Таблица 1.2 – Таблица значений выборки в виде вариационного ряда
№ значения выборки |
Значения выборки (х) |
№ значения выборки |
Значения выборки (х) |
1 |
0,15 |
11 |
4,44 |
2 |
0,34 |
12 |
4,85 |
3 |
0,99 |
13 |
5,01 |
4 |
1,11 |
14 |
5,15 |
5 |
1,57 |
15 |
5,55 |
6 |
2,23 |
16 |
6,55 |
7 |
2,34 |
17 |
6,72 |
8 |
2,34 |
18 |
7,11 |
9 |
2,48 |
19 |
8,63 |
10 |
4,15 |
20 |
9,81 |
Используя значения выборки, построим группированный ряд наблюдений.
Определим min и max значения выборки:
хmin = 0,15 хmax = 9,81
2.2 Разобьем весь диапазон [хmin, хmax] на k равных интервалов, где количество интервалов рассчитывается по формуле (1.1). Результат округляем до ближайшего целого числа.
,
(1.1)
где n – число элементов в выборке.
Получаем:
Определим ширину интервала по формуле (1.2). Результат вычисления округляем до ближайшего целого.
,
(1.2)
где хmin – минимальное значение выборки;
хmax – максимальное значение выборки;
k – количество интервалов.
Получаем:
Определим крайние точки каждого интервала C0, C1, C2…, при этом можно пользоваться различными способами, например:
если C0 = хmin, тогда:
C1= хmin+∆ C2= хmin+2·∆ и т.д.
2) если C0= хmin - ∆/2, получаем:
C0= хmin - ∆/2 C1= C0+∆ C2= C1+∆ и т. д.
по формуле (1.3) находим середину интервала [хmin, хmax]
(1.3)
Затем от точки С откладываем в обе стороны значение, равное величине ∆.
Воспользуемся первым способом и определим крайние точки каждого интервала:
C0= хmin= 0,15
C1= хmin+∆ = 0,15+2 = 2,15
C2= хmin+2·∆ = 0,15+2·2 = 4,15
C3= хmin+3·∆ = 0,15+3·2 = 6,15
C4= хmin+4·∆ = 0,15+4·2 = 8,15
C5= хmin+5·∆ = 0,15+5·2 = 10,15
C6= хmin+6·∆ = 0,15+6·2 = 12,15
Зная крайние точки каждого интервала, определим их середину по формуле (1.4)
,
(1.4)
где n – номер интервала.
Получаем:
Определим частоту для каждого интервала (число выборочных данных попавших в каждый из интервалов).
Так как значения могут совпадать с границами интервалов, условимся в каждый k-ый интервал включать наблюдения большие или равные, чем нижняя граница интервала и меньше верхней границы, т,е. Ck-1 ≤ х < Ck.
Общее
число наблюдений, отнесённое к k-му
интервалу равно частоте νk
данного интервала. Причём сумма частот
всех интервалов (
)
не должна превышать общего числа
элементов в выборке.
Накопленная
частота для каждого интервала
равна сумме частот (k
– 1)
и k
интервалов.
Подсчитаем
частоту
и накопленную частоту
для каждого интервала. Все расчеты
сведем в таблицу 1.3.
Таблица 1.3 – Расчет частот для каждого интервала
k |
(Ck, - Ck+1) |
|
|
|
1 |
(0,15 – 2,15) |
1.15 |
5 |
5 |
2 |
(2,15 – 4,15) |
3.15 |
4 |
9 |
3 |
(4,15 – 6,15) |
5.15 |
6 |
15 |
4 |
(6,15 – 8,15) |
7.15 |
3 |
18 |
5 |
(8,15 – 10,15) |
9.15 |
2 |
20 |
6 |
(10,15 – 12,15) |
11.15 |
0 |
20 |
2.7
Вычислим эмпирический аналог функции
плотности
для каждого из интервалов (Ck,Ck+1)
по формуле (1.5)
,
(1.5)
где ∆ - ширина интервала,
n - число элементов в выборке,
- частота k интервала.
Для нашего примера:
Вычислим эмпирическую функцию распределения
для каждого из интервалов (Ck,
Ck+1)
по формуле (1.6).
,
(1.6)
где - накопленная частота k интервала
Для нашего случая:
Для дальнейшего удобства построения гистограммы и для всеобщей наглядности сведём все полученные нами ранее расчеты в сводную таблицу (Таблица 1.4)
Таблица 1.4 – Сводная таблица полученных данных
k |
(Ck - Ck+1) |
|
|
|
|
|
1 |
(0,15 – 2,15) |
1,15 |
5 |
5 |
0,125 |
0,25 |
2 |
(2,15 – 4,15) |
3,15 |
4 |
9 |
0,1 |
0,45 |
3 |
(4,15 – 6,15) |
5,15 |
6 |
15 |
0,15 |
0,75 |
4 |
(6,15 – 8,15) |
7,15 |
3 |
18 |
0,075 |
0,9 |
5 |
(8,15 – 10,15) |
9,15 |
2 |
20 |
0,05 |
1 |
6 |
(10,15 – 12,15) |
11,15 |
0 |
20 |
- |
1 |
Для построения гистограммы (рисунок 1.1) на оси абсцисс откладываем крайние точки каждого из интервалов C0, C1, C2…, а по оси ординат – эмпирический аналог функции плотности
,
тогда k-му
интервалу будет соответствовать
прямоугольник, основанием которого
является замкнутый слева интервал [
Сk-1,Ck),
а высота равна
.
Если на верхних гранях полученных прямоугольных областей отложить точку середины каждого интервала и соединить полученные точки, то получим ломаную линию называемую полигоном.
Геометрическое представление эмпирической функции распределения называют кумулятивной прямой или кумулятой.
Для этого на оси абсцисс откладывают границы интервалов C0, C1, C2…, а по оси ординат – значения функции распределения . Причём, значение функции распределения относят к верхней Ck границе k-ого интервала (рисунок 1.2).
Рисунок 1.1 – Гистограмма и полигон распределения признака
Рисунок 1.2 – Эмпирическая функция распределения
