Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
вопросы госы 2021.docx
Скачиваний:
101
Добавлен:
01.06.2021
Размер:
10.49 Mб
Скачать

Дисциплина «Статистическая обработка информации»

  1. Разделы статистической обработки информации: теория оценок, теория проверки статистических гипотез

Статистика является разделом математики, посвященным анализу экспериментальных данных, полученных в ходе наблюдения за некоторым объектом. В зависимости от решаемых в ходе анализа задач можно провести условное разделение математической статистики на два направления: описательная (дескриптивная) статистика и теория статистических выводов (индуктивная статистика).

Описательная (дескриптивная) статистика (англ. descriptive statistics) решает задачи систематизации экспериментальных данных, их наглядного представления в виде графиков и эмпирических зависимостей, а также количественного анализа отдельных статистических показателей (напр. среднего значения, разброса, тренда и пр.). Типичным примером применения описательной статистики является представление результатов соц. опроса в виде круговых диаграмм или графики колебания цен на нефть.

Теория статистических выводов (англ. inferential statistics) решает задачи применения выборочной информации (полученной, например, в ходе эксперимента) для выявления количественных и качественных характеристик наблюдаемого объекта. Примером может служить экспериментальная оценка среднего времени выполнения запроса к базе данных или попытка дать ответ на вопрос, прием данных с какого из доступных серверов наиболее надежен.

Приведенное деление является в известной степени условным, и зачастую статистическая обработка информации начинается с применения чисто описательных методов, а в дальнейшем завершается применением теории статистических выводов.

Теорию статистических выводов, в свою очередь, можно разделить на теорию оценивания и теорию проверки гипотез. Теория оценивания призвана количественно охарактеризовать интересующий исследователя параметр объекта: либо предположить его конкретное значение (точечное оценивание), либо предположить наиболее вероятный диапазон его значений (интервальное оценивание). Теория проверки гипотез позволяет на основе экспериментальных данных дать ответ на заранее заданный вопрос касательно свойств объекта (осуществить выбор одной из альтернативных гипотез).

  1. Смещенность оценки; примеры смещенных и несмещенных оценок

Так как оценка является функцией от нескольких случайных величин (элементов выборки), то очевидно, что и сама оценка является случайной величиной. Таким образом, оценка может принимать значение как превышающее истинное, так и, наоборот, заниженное. Естественным желанием является то, чтобы в среднем оценка совпадала с истинным значением, т.е.:

.

Такая оценка называется несмещенной. Можно ввести величину , характеризующую величину смещения, вносимого при использовании алгоритма по выборке объема N:

Здесь и далее обозначает оценку параметра при помощи алгоритма по выборке объема N. Если , то оценка является смещенной. Возможны также случаи, когда для конечного N оценка – смещенная, но:

.

Данная оценка называется асимптотически несмещенной. Т.е. при достаточно большом объеме выборки N, величиной смещения можно пренебречь.

Таким образом, можно сказать, что смещение оценки – это разность между математическим ожиданием оценки и истинным значением оцениваемого параметра, несмещенная оценка – это оценка, имеющая нулевое смещение при любом объеме выборки, а смещенная оценка – это оценка, имеющая не нулевое смещение.

Пример несмещенной оценки:

При анализе трафика, передаваемого с сервера на компьютеры клиентов, производится оценка среднего размера пакета передаваемого по сети. Для этого из общего потока выбирается N пакетов, размеры которых фиксируются и усредняются. В данном примере случайная величина характеризует размер пакета, искомый параметр - среднее значение (т.е. ), элементы выборки - размеры зарегистрированных пакетов, алгоритм оценивания . Проверим, является ли данная оценка смещенной:

Таким образом, данная оценка является несмещенной.

Пример смещенной оценки:

Пусть известно, что время отклика базы данных на запрос пользователя является равномерно распределенной случайной величиной в диапазоне . Задачей исследователя является выяснение величины - т.е. худшего случая, при котором задержка максимальна. Применяется следующая оценка: , т.е. максимальная задержка, зарегистрированная в ход проведения эксперимента, состоящего из N запросов. Для упрощения выкладок при проверке смещенности данной оценки введем следующее обозначение для максимального элемента выборки (т.е. и ). Найдем интегральную функцию распределения величины :

Для того чтобы максимальный элемент выборки не превосходил x, необходимо и достаточно, чтобы каждый элемент выборки не превосходил x. Обратное также верно. Тогда, учитывая независимость случайных величин получим:

Учитывая, что функция описывает равномерное распределение в диапазоне , получим:

.

Воспользовавшись формулой получим выражение для плотности вероятности :

.

Тогда:

Таким образом, данная оценка является смещенной, причем:

Очевидно, что и рассмотренная оценка является асимптотически несмещенной.

Соседние файлы в предмете Государственный экзамен