Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка ЛР по ТВИМС.doc
Скачиваний:
17
Добавлен:
31.08.2019
Размер:
1.89 Mб
Скачать

2. Компьютерное исследование точности

статистических методов

Методы математической статистики главным образом основаны на законах больших чисел, имеющих предельный характер, и на группе теорем, утверждающих предельные свойства некоторых распределений (в основном, нормального).

В первую очередь используются:

Теорема Чебышева, утверждающая, что при неограниченном увеличении числа некоррелированных наблюдений случайной величины X, их среднее арифметическое сходится по вероятности к математическому ожиданию X:

, (2.1)

где n – число наблюдений; xi – значение X в i-ом опыте; ε > 0 – произвольно малое число.

Формула (2.1) хорошо поясняет понятие вероятностной сходимости;

центральная предельная теорема, утверждающая, что при неограниченном увеличении числа независимых слагаемых распределение их суммы стремится к нормальному. При этом должно выполняться условие, что ни одно из слагаемых по своему влиянию на сумму не превалирует над другими:

(2.2)

где интеграл вероятностей.

Можно привести следующий практический пример использования теорем (2.1) и (2.2). Если объем случайной выборки достаточно велик, то в качестве оценки математического ожидания X можно на основании (2.1) принять среднее арифметическое наблюдений, а точность такого оценивания будет определяться на основе (2.2) в соответствии с нормальным законом распределения с параметрами и

Однако если объем случайной выборки невелик, то нельзя утверждать, что среднее арифметическое будет близко к математическому ожиданию X и его распределение будет нормальным (за исключением случая, когда сама наблюдаемая величина распределена по нормальному закону). Например, при n=2 распределение среднего арифметического при равномерном распределении X будет подчинен закону Симпсона, при экспоненциально распределенной X – закону Эрланга, а при пуассоновском сохранится распределение Пуассона. Если же закон распределения наблюдаемой величины неизвестен, то в случае малой выборки установить распределение среднего арифметического невозможно, хотя при выборках достаточно большого объема на основании (2ю2) можно утверждать, что оно будет нормальным. И чем больше n, тем точнее это утверждение.

Приведенный частный пример весьма характерен и его можно обобщить следующим образом. Законы больших чисел, и в частности теорема Чебышева, дают основания оценивать числовые характеристики, имеющие форму математического ожидания (т.е. моменты), путем вычисления соответствующих средних арифметических.

Так как среднее арифметическое имеет вид суммы, то его предельное распределение является нормальным, что позволяет вычислить точность оценок. Однако это справедливо лишь для достаточно больших выборок. В тех случаях, когда число элементов выборки невелико, использование предельных значений оценок и их распределений некорректно.

Исследование точности методов статистической обработки было неразрешимой задачей из-за того, что экспериментатор имел в своем распоряжении лишь одну случайную выборку ограниченного объема и, не зная генеральной совокупности, не мог проверить делаемые статистические выводы. Аналитические же исследования процедур оценивания могут считаться корректными, лишь если известна функциональная форма распределения наблюдаемой величины. Но даже и в последнем случае можно, столкнуться с весьма большими трудностями вычислительного характера.

В последние годы, благодаря развитию средств вычислительной техники и, в частности, методов генерация псевдослучайных чисел, ситуация резко изменилась. Если принять, что оценка точности статистических методов, сделанная на «искусственной случайности» ( на псевдослучайных выборках), может быть распространена на случайность «естественную», то исследователи получили возможность экспериментировать с произвольно распределенными выборками любого объема. Суть дела в том, что компьютерная генерация псевдослучайных чисел позволяет получить в нужном количестве выборки заданной длины из известной генеральной совокупности. При этом сама генеральная совокупность может быть описана как с помощью формул, так и задаваться таблично, т.е. по желанию исследователя может быть подчинена любому закону распределения.

Так как статистики, используемые для оценивания законов распределения и их параметров, носят случайный характер, то их исчерпывающими характеристиками являются законы распределения самих этих статистик. Используя генерацию псевдослучайных чисел, такие распределения можно получать с произвольной точностью. Для этого можно использовать следующий алгоритм (последовательность действий).

  1. Задаемся законом распределения наблюдаемой случайной величины X – F(x).

  2. Генерируем в соответствии с X выборку интересующего нас объема n.

  3. На основании сгенерированной выборки вычисляем значение исследуемой статистики Sn.

  4. Повторяем п. 2, 3, используя при генерации каждой новой выборки новое стартовое число, и в результате N таких повторений получаем выборку объема N, содержащую информацию о распределении интересующей нас статистике Sn.

при этом число повторений N практически неограниченно, что позволяет получать информацию о Sn с произвольной точностью (в смысле закона больших чисел).

  1. Обрабатывая полученный статистический материал и зная исходное распределение X, можно делать выводы о влиянии объема выборки On, закона распределения X, применяемого метода оценивания и т.п., на качество результатов статистической обработки наблюдений.