
3. Элементы математической статистики.
Теория вероятностей (ТВ) и математическая статистика (МС) органически переплетаются друг с другом и разделение их на самостоятельные разделы математики обусловлено скорее методологическими мотивами, чем практической или теоретической необходимостью. Исторически статистика много старше теории вероятностей. Первая представляет собой разновидность эксперимента, опыта, связанного со сбором информации о количественных характеристиках наблюдаемых явлений, состояний. Вторая, будучи абстрактным обобщением опыта, питается порождаемыми этим опытом идеями, проверяет идеи в последующих экспериментах и, накопив некоторую критическую массу, порождает собственные идеи, вновь проверяемые на практике. Процесс этот бесконечен и плодотворен, так как дает в руки исследователя необходимый инструментарий для деятельности.
Статистика зародилась как наука о ресурсах, необходимость учета которых становилась все более очевидной с развитием цивилизации. Со временем, появилось достаточно знаний, подтолкнувших математические умы к выработке теоретических основ статистики. Произошло это в XVII веке. Справедливости ради, необходимо отметить, что немалую роль здесь сыграли исследования азартных игр.
Дальнейшее взаимное проникновение статистики и исчислений вероятностей привело к расширению обеих наук. В XIX веке в статистике оформилась область, называемая математической статистикой. Научный мир даже пережил некоторую эйфорию, уверовав во всесилие новой науки и перенося ее методы на те области деятельности, где она не применима в силу отсутствия статистической устойчивости частот. Кроме того, необходимо напомнить, что статистика вообще и математическая в частности наблюдает лишь следствия, не вскрывая причины. Однако, она может подсказать нам, где искать причину того или иного результата.
МС решает три основные задачи:
предварительный анализ материала с целью высказывания предположений о законах распределения наблюдаемых явлений, о параметрах этих законов, о стохастической несвязанности наблюдений и т.п.;
нахождение оптимальных приближенных значений тех или иных параметров и/или числовых характеристик предполагаемых распределений;
проверка статистических гипотез как о законах распределений, так и о числовых характеристиках последних.
Решение указанных задач составляет содержание трех разделов предлагаемого курса:
Выборочный метод;
теория оценивания;
статистические гипотезы.
3.1 Выборочный метод.
3.1.1 Генеральная совокупность, выборка, выборочные моменты.
Главное, что объединяет ТВ и МС – это понятие случайной величины (СВ). СВ имеет совокупность возможных значений или спектр (см. 2.2.1), который в МС называется генеральной совокупностью (ГС). ГС сохраняет то же обозначение X, что и СВ. Она может быть дискретной или непрерывной, конечной или бесконечной.
Для изучения ГС ставится эксперимент, в результате которого мы наблюдаем то или иное конечное дискретное подмножество ГС, называемое выборкой. Необходимость перехода от ГС к выборке связана с тем, что ГС может быть непрерывной или большой по объему. Обследование ГС может быть дорогостоящим или связанным с разрушением, выводом из строя её элементов. Естественно, что в такой ситуации мы вынуждены довольствоваться не ГС, а её подмножеством – выборкой. Последняя несёт в себе информацию о ГС как целом, так и в частностях, т.е. о законе распределения и о числовых характеристиках.
Мы будем полагать, что всякий результат xi, попавший в выборку, является элементом ГС X, т.е.
xi
X. (171)
Данное теоретическое предположение на практике может быть нарушено, т.е. выборка может содержать элементы не одной, а нескольких ГС. Проверка подобной возможности представляет одну из важнейших задач МС. Методы ее решения будут рассмотрены в последующих главах, а пока будем считать условие (171) выполняемым.
Для того, чтобы выборка наилучшим образом характеризовала ГС, она должна быть представительной и случайной. Представительность или репрезентативность выборки заключается в том, что при сборе информации о ГС весь спектр последней должен быть отражён в выборке. Случайность выборки состоит в том, что в момент обследования ГС в целом или по частям, когда ГС велика по объему, любой элемент обследуемой области должен иметь возможность попасть в выборку.
Формально выборка представляет собой последовательность результатов эксперимента x1, x2, …, xi, xj,…, xn. Далее, выборка может быть ранжирована по возрастанию, когда xi < xj, или по убыванию, когда xi > xj. Убывающая или возрастающая по модулю выборка называется вариационным рядом, т.е. |xi| < |xj| или |xi| > |xj|.
Выборка характеризуется некоторым законом распределения. Основная аналитическая форма такого закона – это выборочная функция распределения. Выборочная ФР (xi) представляет собой частость тех значений X, которые меньше xi, т.е.
(xi)
= Q(X
< xi
) =
. (172)
Выборочную ФР проще вычислить по номерам выборки, ранжированной по возрастанию:
(xi) = (i – 1) / n.
Выборочный закон распределения имеет свои числовые характеристики – выборочные моменты, определяемые следующими выражениями:
Начальный выборочный момент порядка «r»:
= (
)
/ n. (173)
Начальный выборочный
момент первого порядка
носит название среднее
арифметическое
или выборочное
среднее
и обозначается
:
=
= (
)
/ n. (174)
Центральный выборочный момент порядка «r»:
= (
)
/ n. (175)
Центральный
выборочный момент второго порядка
называется выборочная
дисперсия
и обозначается s2:
= s2
= (
)
/ n
=
-
= (
)
/ n
-
. (176)
Абсолютный центральный выборочный момент порядка «r»:
= (
)
/ n. (177)
Абсолютный
центральный выборочный момент первого
порядка
называется выборочным
отклонением
или средней
ошибкой
и обозначается буквой
:
=
= (
)
/ n. (178)
Перечисленные выборочные моменты используются в качестве приближенных значений соответствующих числовых характеристик ГС.
Генеральная
совокупность, так же как и СВ, может быть
многомерной. В этой ситуации также
определяются выборочные моменты.
Наиболее важным из них является смешанный
центральный момент второго порядка –
выборочная
ковариация,
которая обозначается
:
=
=
-
*
=
=
=
()/(
)
-
. (179)