
Математическая статистика
Лабораторные работы
Г.Красноярск Лабораторная работа № 1
«Группирование экспериментальных данных, вычисление основных числовых характеристик выборки»
Цель работы:
Знакомство с методами предварительной обработки экспериментальных данных.
Задание:
1. Построить интервалы группирования, выбрав оптимальным образом их число и длину.
Построить вариационные ряды, гистограммы и полигоны частот для выборок X и Y.
Вычислить числовые характеристики выборок X и Y: выборочную среднюю, исправленную дисперсию, коэффициент корреляции.
Содержание отчета:
Краткая постановка задачи.
Краткое описание выполнения задачи.
Таблицы, графики, результаты вычислений.
Сведения из теории
Пусть исследуется
какой-то признак большой однородной
группы изделий. Выборкой называется
совокупность значений признака у
случайно отобранных n
объектов. При большом n
используется прием группировки данных.
Рассмотрим эту процедуру на примере
признака X. При
группировке данных измерения (варианты)
удобнее распределять по интервалам
равной длины:
,
,…,
.
Пусть
и
соответственно максимальное и минимальное
значения признака X.
Длину интервала находят по формуле:
,
где N
– число интервалов группирования,
удовлетворяющее условиям:
N – нечетное
0,55*n0,4<N<1,25* n0,4
Точки ai находят по формулам:
Середины
интервалов группирования
находят по формулам:
Ни
одно значение
не должно остаться за пределами
интервалов.
Если
значений выборки X
принадлежит i-му
интервалу, то
называется частотой
попадания
выборки в i-й
интервал, а число
-
относительной
частотой.
Обязательно
проверить, чтобы
,
а
.
Вариационным
рядом называют
таблицу, содержащую середины интервалов
группирования и соответствующие данным
интервалам частоты и относительные
частоты. Кроме того, последняя строка
таблицы содержит значения плотностей
частоты
,
необходимые для построения полигона и
гистограммы.
Полигон
частот –
ломаная линия, отрезки которой соединяют
точки
.
Гистограмма
– набор N
прямоугольников с основаниями, равными
h
и высотами на каждом отрезке
,
равными
.
Вариационный ряд должен иметь вид:
X |
|
|
… |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Полигон относительных частот имеет вид:
.
. .
Гистограмма имеет вид:
. . .
Аналогичную работу проводим для признака Y.
Для
вычисления выборочного коэффициента
корреляции строим таблицу, называемую
корреляционной, которую заполняем
частотами
-
число пар
,
попавших в прямоугольник с i-м
номером интервала для X
и j-м
номером интервала для Y:
Y X |
|
|
|
|
|
|
|
… |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
… |
|
|
|
|
|
|
|
|
|
|
Обязательно проверить, чтобы сумма всех частот была равна объему n.
Числовые
характеристики:
-
выборочную среднюю,
-
выборочную дисперсию,
-
исправленную выборочную дисперсию,
-
выборочный коэффициент корреляции
вычисляем по формулам:
Аналогичные формулы для выборки Y.