- •Предмет и задачи математической статистики
- •§1. Описание и упорядочение статистического материала
- •1. Статистический ряд. Его первичная обработка
- •2. Графическая обработка статистического ряда
- •3. Числовые характеристики выборки
- •4. Вычисление выборочных средней и дисперсии при больших (очень малых) значениях вариант
- •§2. Оценка параметров распределения
- •§2.1 Точечные оценки параметров распределения генеральной совокупности
- •1. Понятие точечной оценки параметров
- •2. Метод моментов
- •1. Оценка одного параметра.
- •2. Оценка двух параметров.
- •3. Метод наибольшего правдоподобия
- •2. Непрерывные случайные величины.
- •4. Точечная оценка вероятности события
- •5. Точечная оценка математического ожидания
- •6. Точечная оценка дисперсии
- •§2.2 Интервальные оценки параметров распределения генеральной совокупности
- •1. Понятие интервальной оценки параметров
- •2. Односторонние доверительные интервалы
- •3. Доверительный интервал для оценки вероятности
- •4. Доверительный интервал для оценки математического ожидания:
- •5. Доверительный интервал для оценки среднего квадратического отклонения
- •§3. Проверка статистических гипотез
- •1. Гипотезы. Постановка вопроса
- •2. Статистики сравнения точечных оценок неизвестных генеральных
- •1) Проверка гипотез для одной выборки
- •2) Проверка гипотез для двух независимых выборок
- •3. Построение теоретического закона распределения св по опытным данным
- •Дискретная св
- •Непрерывная св
- •4. Проверка гипотез о законе распределения
- •5. Критерий пирсона для проверки гипотезы о виде дифференциальной функции распределения св
- •6. Критерий колмогорова для проверки гипотезы о виде интегральной функции распределения непрерывной св
- •§4 Теория корреляции
- •1. Понятие о корреляционной зависимости
- •2. Теснота корреляционной связи
- •Линейная регрессия
- •3.1. Проверка гипотезы о наличии линейной зависимости
- •3.2 Поиск уравнения связи
- •3.3 Теснота линейной корреляционной связи
- •4. Нелинейные корреляционные связи
- •5. Показатели качества (адекватности) регрессии
- •6. Множественная корреляция
Предмет и задачи математической статистики
МС называется наука, занимающаяся разработкой методов получения, описания и обработкой опытных данных с целью изучения закономерностей случайных массовых явлений.
Задачи МС:
|
|
Множество всех изучаемых объектов называется генеральной совокупностью. Число N (конечное или бесконечное) объектов (наблюдений) в совокупности называется её объёмом.
Множество случайно отобранных объектов называется выборочной совокупностью (выборкой). n – объём выборочной совокупности (
).
Оцениваемые характеристики рассчитываются
для выборки и объявляются оценками
характеристик всей совокупности. Чем
больше
,
тем с большим основанием можно судить
о свойствах генеральной совокупности.
Различают следующие виды выборок:
простая или собственно-случайная выборка, при которой из генеральной совокупности случайным образом извлекают по одному объекту;
механическая выборка, когда элементы отбирают через определённый интервал, например каждая десятая деталь;
типическая выборка характеризуется случайным отбором элементов из типических групп (например, мнение о прошедших выборах спрашивают у случайно отобранных людей, разделённых по признаку пола, возраста, социального статуса, …);
серийная выборка, в которую случайным образом отбираются не отдельные элементы, а целые группы совокупности подвергаются сплошному наблюдению (сдача ЕГЭ по математике выпускниками школ).
Используют два способа образования выборки:
повторный отбор (с возвращением), когда случайно отобранный и уже обследованный объект, возвращается в общую совокупность и теоретически может быть повторно отобран;
бесповторный отбор, когда отобранный элемент не возвращается в общую совокупность.
§1. Описание и упорядочение статистического материала
1. Статистический ряд. Его первичная обработка
Таблица, в которой содержатся номера опытов и соответствующие результаты измерений, называется статистическим рядом.
Значение признака в i–ом опыте называется вариантой (xi).
Кратностью или частотой
варианты называется количество опытов,
в которых наблюдалось одно и то же
значение варианты.
(n – объём выборки)
Относительной частотой варианты называется отношение кратности варианты к объёму выборки:
.
Относительная
частота
является статистическим аналогом
вероятности
.
Дискретным вариационным рядом называется упорядоченный (ранжированный) ряд различных значений признака (в порядке возрастания или убывания) и соответствующих им кратностей или частот.
-
…
Σ
…
…
Если объём выборки велик, интервал
,
которому принадлежат все варианты,
разбивается на частичные интервалы
(чаще одинаковой длины).
Число интервалов k следует брать не очень большим, чтобы после группировки ряд не был громоздким, и не очень малым, чтобы не потерять особенности распределения признака.
Число интервалов может быть определено
по формуле Стерджеса:
,
где
,
значение
подбирается целым.
Такой способ определения числа интервалов (1) является лишь рекомендуемым, но не обязательным.
Длина интервала находится по формуле:
.
За начало первого частичного интервала,
как правило (но не обязательно), выбирается
точка
.
В первую строку таблицы интервального
ряда вписывают частичные промежутки
,
,
…,
,
имеющие одинаковую длину h,
при этом весь интервал
должен полностью покрывать все имеющиеся
значения признака, т. е.
,
.
Во второй строке вписывают количество
наблюдений
(
),
попавших в каждый интервал. Таким
образом, статистическое распределение
примет вид:
-
…
Σ
…
…
Интервальный вариационный ряд содержит интервалы разбиения и соответствующую им сумму кратностей или частот вариант, которые попали в данный интервал разбиения.
Накопленные
кратности
(относительные
частоты
)
для каждого интервала находятся
последовательным суммированием
кратностей (относительных частот) всех
предшествующих интервалов, включая
данный. Накопленная кратность показывает,
сколько наблюдалось вариантов со
значением признака, меньшим чем х.
