
Математическая статистика
6. Основные понятия математической статистики.
6.1. Предмет математической статистики.
Мы закончили краткое изложение элементарной теории вероятности и приступаем к изложению основ математической статистики. Эти две дисциплины жестко связаны. Если первая изучает математические закономерности в мире случайных событий и случайных величин, являясь теоретическим фундаментом статистического метода, то вторая имеет дело со случайными экспериментами и изучает математические и методические основы организации, обработки, анализа и интерпретации случайных экспериментов.
Поскольку отдельный эксперимент, опыт, измерение не отражает статистической структуры изучаемого явления, основным методом является проведение серий, последовательностей экспериментов, опытов, измерений. Например, однократное измерение напряжения на выходе некоего электронного блока не отражает распределения вероятностей напряжения как случайной величины, но многократные измерения этого напряжения дают информацию о его статистических характеристиках.
Каждая систематическая сводка результатов последовательности экспериментов будет образовывать множество статистических данных, относящихся к изучаемому явлению. В общем виде задача заключается в том, чтобы определить:
возможно ли и как получить надежные выводы из статистических данных;
какова степень надежности этих выводов;
как организовать последовательность случайных экспериментов, чтобы повысить надежность и точность выводов;
какова предельная информативность множества статистических данных при различных ограничениях условий и методики экспериментов, и при различной предзаданности структуры экспериментов.
Более конкретно, математическая статистика решает 3 задачи:
1) Оценивание распределения генеральной совокупности или его параметров.
2) Испытание статистических гипотез.
3) Синтез статистической модели изучаемых явлений.
6.2. Виды отбора.
Начнем с примеров.
Пример 1. Пусть последовательно многократно измеряется на интервале времени (t, t+Т) напряжение на выходе некоего электронного блока с целью описать влияние на этот блок шумов и помех. В таких случаях говорят, что производится дискретный отбор выходного напряжения, Т называетcя временем отбора. Зависимость измеряемого напряжения от времени представляет собой т. н. случайный процесс. Возможны различные варианты отбора. Условия измерения и локальные статистические характеристики напряжения могут меняться или не меняться за время отбора, во втором случае условия называются стационарными, а отбор - однородным. Интервал между последовательными измерениями (шаг отбора) может быть разным или одинаковым, во втором случае отбор называется эквидистантным. При эквидистантном отборе в зависимости от шага отбора соседние измерения могут давать независимые, слабо зависимые, или существенно зависимые случайные величины. Соответственно отбор называется независимым, слабо зависимым, зависимым.
Пример 2. Пусть в разных точках некоторой области земной поверхности измеряется электропроводность почвы. Как функция точки на плоскости электропроводность представляет собой двумерное скалярное случайное поле. Цель измерений - установление статистических характеристик этого поля. В данном случае проводится дискретный пространственный отбор. Он также может быть однородным или неоднородным, зависимым или независимым и т. д.
Пример 3. Несколько раз бросается игральная кость с целью экспериментального изучения статистических характеристик выпадающих чисел. Отбор заведомо независимый и однородный, вопрос об эквидистантности в данном случае смысла не имеет.
Пример 4. Для изучения турбулентного потока в некоторой его точке периодически измеряется вектор скорости. Как функция точки в пространстве этот вектор представляет собой трехмерное векторное случайное поле. Каждый отсчет вектора скорости дает тройку vx, vy, vz проекций в выбранной системе координат. Вектор v=(vx, vy, vz) можно считать реализацией трехмерной случайной величины V. Именно для изучения статистических характеристик этой величины и предназначен эксперимент.
Однородный и независимый отбор называется простым. Только такой отбор рассматривается далее. Результат отбора называется выборкой. При простом отборе выборка также называется простой и представляет собой набор из n значений, которые называются выборочными значениями, а их число n - объемом выборки. Обычно для получения более точной информации берут n>>1. Выборочные значения, принадлежащие одной простой выборке, можно представлять себе как реализации n независимых одинаково распределенных случайных величин, или, что то же самое, как n независимых реализаций одной и той же случайной величины. Далее мы будем называть эту СВ генеральной, а ее распределение - генеральным распределением. Ансамбль значений (не путать с выборочными значениями!) генеральной СВ иногда называют генеральной совокупностью, а отбор - выбором из генеральной совокупности. Генеральная СВ может быть дискретной или непрерывной, одномерной или многомерной. Соответственно, выборку называют одномерной или многомерной. Выборочное значение одномерной выборки представляет собой число, многомерной - набор чисел. В дальнейшем, если не указано иное, будет иметься в виду одномерная выборка. Чаще всего будем записывать простую одномерную выборку в виде x1, x2, ..., xn , или в виде {xk}, k=1, 2, ..., n.