- •Содержание
- •Введение
- •Объем дисциплины и виды учебной работы
- •Тематический план дисциплины
- •Программа курса
- •Тема 1. Элементы линейной алгебры и аналитической геометрии.
- •Тема 2. Элементы математического анализа.
- •Тема 3. Основные понятия теории вероятностей и математической статистики.
- •Планы аудиторных занятий
- •Методические рекомендации по изучению дисциплины и по организации самостоятельной работы студентов
- •Тема 1. Элементы линейной алгебры и аналитической геометрии.
- •1.1. Матрицы и определители
- •1.2.Действия над матрицами.
- •1.3.Системы линейных уравнений.
- •Элементы аналитической геометрии
- •Тема2 Элементы математического анализа
- •2.1. Функции одной переменной. Элементарные функции (фоп)
- •2.2. Предел и непрерывность функции одной переменной
- •2.3. Дифференцируемые функции одной переменной
- •2.4. Первообразная функция. Неопределенный интеграл и его свойства
- •Интегрирование функций. Таблица основных формул интегрирования
- •2.5. Методы интегрирования: непосредственное интегрирование, интегрирование по частям, замена переменной Непосредственное интегрирование
- •Определенный интеграл
- •Методы интегрирования
- •Тема 3. Основные понятия теории вероятностей и математической статистики.
- •Основные понятия теории вероятностей
- •Понятия пространства элементарных событий и случайного события. Основные формулы комбинаторики
- •2. Геометрическое определение вероятности
- •3.2. Случайные величины
- •3.3.Элементы математической статистики
- •Примеры контрольных заданий.
- •Литература
- •Вопросы для подготовки к экзамену
3.3.Элементы математической статистики
Опорный конспект
15.1. Основные понятия математической статистики. О: Выборка -совокупность значений СВ , полученных в результате независимых экспериментов. О: Статистический ряд: , , , , -относительная частота, -частота появления . О: Статистический ряд по интервалам
-число значений СВ , попавших в . Графическое изображение
О: Эмпирическая функция распределения:
|
15.2. Определение неизвестных параметров распределения О: Для выборки среднее арифметическое ,дисперсия ; для статистического ряда: , ; , -числовые характеристики СВ с выборкой , . О: Доверительный интервал , - точность оценки параметра в функции распределения СВ , -коэффициент доверия. Для нормального распределения с параметрами при . Для двумерной СВ с выборкой выборочный коэффициент корреляции , . |
Основные понятия математической статистики Построение эмпирических законов распределения
Математическая статистика – наука о методах обработки экспериментальных данных, полученных при изучении закономерностей в случайных массовых явлениях. Способ статистической обработки, равно как и ценность её результатов полностью зависит от положенной в основу вероятностной модели, которая должна объяснить вероятностную структуру наблюдений.
Пусть произведено независимых экспериментов и получено значений , ,…, случайной величины .
О: Генеральной совокупностью называется множество всех возможных значений случайной величины . Выборкой объёма называется совокупность значений , полученных в результате независимых экспериментов.
По исследованию выборки необходимо сделать правильный вывод о СВ . Например, по толщине покрытия 100 деталей из серии необходимо сделать вывод о качестве покрытия деталей. В этом случае классическую вероятность заменяют статистической.
О: Статистическим рядом называется таблица, в которой записываются в упорядоченном по возрастанию виде различные элементы выборки , , и относительные частоты ( - частота появления ):
, . (15.1)
При большом числе измерений анализ такого материала затруднителен. Поэтому поступают следующим образом.
Составляется статистический ряд по интервалам или вариационный ряд. Весь интервал полученных значений величины разбивается на интервалы , ,…, , подсчитываются относительные частоты , где - число значений величины , попавших в , и строится таблица:
(15.2 )
Графическими изображениями статистических рядов являются полигон и гистограмма.
Полигон состоит из отрезков, соединяющих точки , , где в случае ряда по интервалам - срединное значение интервала (рис. 15.1)
|
|
|
Рис 15.1. |
|
Рис. 15.2. |
Гистограмма служит для изображения интервального статистического ряда (15.2). По оси откладывают интервалы , варьирования СВ и на этих отрезках строят прямоугольники с высотами (рис. 15.2).
О: Эмпирической функцией распределения СВ , для которой составлен статистический ряд (15.2), называется
При малых , и больших функция близка к теоретической функции распределения .
Пример. Толщина покрытия стального шарика в гальваническом производстве – случайная величина . Из партии отобрали случайным образом 20 шариков и измерили толщину покрытия в микрометрах.
: 6,99; 5,10; 5,61; 7,25; 5,45; 5,88; 7,92; 6,10; 5, 90; 6,22; 6,55; 6,34; 6,66; 6,48; 6,76; 6,87; 6,91; 7,05; 7,30; 7,70.
Построить статистический ряд по интервалам, гистограмму и график .
Решение. Определяем , , т.е. все значения выборки . Разобьём этот интервал на 6 частей с и построим статистический ряд.
Номер интервала |
1 |
2 |
3 |
4 |
5 |
6 |
Интервал |
[5,0;5,5) |
[5,5;6,0) |
[6,0;6,5) |
[6,5;7,0) |
[7.0;7,5) |
[7,5;8] |
Относит. частота |
2/20 |
3/20 |
4/20 |
6/20 |
3/20 |
2/20 |
Гистограмма статистического ряда представлена на рис. 15.3. График эмпирической функции распределения изображён на рис. 15.4
|
|
Рис. 15.3. |
Рис.15.4 |
Определение неизвестных параметров распределения и выборочного коэффициента корреляции
Выборочные числовые характеристики. Оценки параметров
Для выборки СВ и для статистического ряда определяются следующие числовые характеристики.
О: Среднее арифметическое выборки это ,
среднее арифметическое статистического ряда (15.1): . Дисперсия выборки это ,
дисперсия статистического ряда (15.1) ‑ .
Среднее квадратичное отклонение: .
Пусть случайная величина с функцией распределения , где - неизвестный параметр распределения, т.е. неизвестная числовая характеристика СВ . Например, имеет нормальное распределение с неизвестным параметром . Рассмотрим выборок , , этой СВ . Обозначим через оценку величины , её можно представить как случайную величину, зависящую от , , т.е. . Чтобы выбрать в некотором смысле лучшую оценку , рассматриваются свойства оценок: несмещённость, состоятельность, эффективность.
О: Оценка параметра называется несмещённой, если её математическое ожидание , состоятельной, если по вероятности сходится к при , т.е. . Несмещённая оценка называется эффективной, если её дисперсия - наименьшая среди всех дисперсий, вычисляемых для оценок по выборкам одинакового объёма.
Т: Среднее арифметическое выборки СВ , имеющей математическое ожидание и дисперсию , является несмещённой и состоятельной оценкой математического ожидания. В случае нормального распределения СВ эта оценка является эффективной.
Пример. Найти параметры распределения СВ в примере п. 15.1, если имеет нормальный закон распределения.
Решение. Плотность вероятности для нормального закона распределения , неизвестные параметры - , . Т.к. (мкм),
(мкм2), то , .
Доверительные интервалы параметров
Рассмотренные выше оценки параметров являются точечными. При малом объёме выборки, чтобы избежать грубых ошибок, вводят интервальную оценку. Обозначим точность оценки параметра через , т.е. , а через - вероятность , т.е. . Последнее условие означает, что интервал покрывает значение с заданной вероятностью . Он называется доверительным интервалом, - коэффициентом доверия. На практике выбирают достаточно близким к 1.
Величины , и объём выборки связаны между собой. Если определены две из них, то можно определить третью.
Пусть случайная величина имеет нормальное распределение с параметрами , .
В качестве оценки берётся . Все элементы , , выборки случайные и имеют то же распределение, что и с параметрами , . Тогда по (15.6) в силу нечётности функции Лапласа : . Обозначим , тогда .
Если задано, то находится по таблице функции Лапласа. Интервал с вероятностью покрывает значение и является доверительным для . При этом предполагается, что известно. Если заменить приближённым значением , то коэффициент доверия уменьшится.
Пример. Найти доверительный интервал с коэффициентом доверия 0,95 для и .
Решение. По таблице Лапласа . Так как , , то имеем , доверительный интервал и .
Выборочный коэффициент корреляции
Пусть проведено независимых испытаний, в результате которых получены выборочные значения двумерной СВ : ( , , …, ).
Аналогично случаю одномерной СВ определяются выборочные числовые характеристики: , , , , .
О: Выборочным коэффициентом корреляции СВ называется .
Пример. Дана выборка СВ :(2,2), (4,5), (6,7), (8,10). Найти .
Решение. , , , , , . Коэффициент корреляции близок к 1, т.е. зависимость между , близка к линейной.
Задача.
В таблице представлены данные по некоторой бригаде, где признак Х − трудовой стаж и Y − разряд.
Х |
8 |
9 |
5 |
7 |
5 |
7 |
9 |
5 |
6 |
5 |
Y |
5 |
6 |
2 |
4 |
6 |
5 |
7 |
6 |
4 |
3 |
1. Для признака Х построим вариационный ряд. Для этого расположим данные в порядке возрастания: 5, 5, 5, 5, 6, 7, 7, 8, 9, 9.
2. Полигоном называется ломанная линия, соединяющая точки (x1, n1), (x2, n2),.., (xr, nr), где ni − частота значения хi.
хi |
5 |
6 |
7 |
8 |
9 |
ni |
4 |
1 |
2 |
1 |
2 |
Рис.1 Полигон распределения
3.1 Мода распределения – это наиболее часто встречающееся значение ряда.
3.2 Выборочное среднее находится по формуле
= (х1+х2+х3+.. +хn)/n.
Средний стаж равен (8+9+5+7+5+7+9+5+6+5)/10=6,6.
Выборочная дисперсия распределения находится по формуле:
.
В нашем примере .
4.2 Оценка стандартного отклонения определяется как корень квадратный из выборочной дисперсии: .
4.3 Формула коэффициента вариации: .
Если Сv ≤ 10%, то варьирование считается слабым,
при 11% ≤ Сv ≤ 25% - средним, и значительным при Сv > 25%.
5. Доверительный интервал для оценки среднего значения нормального распределения при неизвестной дисперсии:
,
где - выборочная дисперсия, а значение находят по таблице “Квантили распределения Стьюдента”.
В таблице представлены данные о работниках бригады: разряд (Х) и стаж работы (Y, лет).
-
X
1
1
2
3
6
Y
1
2
3
4
5
Чаще всего, чем больше стаж работы, тем выше квалификация рабочего и, следовательно, выше его разряд. Поэтому в нашем примере стаж работы (Х) – независимая переменная, а разряд (Y) – зависимая от Х переменная.
Для построения корреляционного поля (диаграммы рассеивания) на координатную плоскость нанесем точки с координатами (1; 1), (1; 2), (2; 3), (3; 4), (6; 5) (рис.2). По конфигурации скопления точек мы можем предположить, что связь между стажем и разрядом есть, причем скорее всего эта связь линейная и положительная.
Найдем коэффициент линейной корреляции. Для удобства представим наши вычисления в виде следующей таблицы:
-
хi
yi
xiyi
1
1
1
1
1
1
2
1
4
2
2
3
4
9
6
3
4
9
16
12
6
5
36
25
30
∑ = 13
15
51
55
51
n = 5.
Выборочный коэффициент корреляции мы будем находить по следующей формуле:
.
, , , ,
.
Полученное значение коэффициента r = 0,92 очень близко к 1, что указывает на сильную зависимость между стажем и разрядом рабочего.
Построим линию регрессии Y на Х.
,
,
y =0,7х + 1,17.
Получаем следующий график.
Рис.2