
Конспект лекций Глазова / 8.1. Две задачи мат статист
.doc8. Испытание статистических гипотез.
8.1. Две основные задачи математической статистики.
Многочисленные и разнообразные вопросы, решаемые в математической статистике, можно, до некоторой степени, разделить на два класса: задачи испытания (проверки) статистических гипотез и задачи оценки параметров распределения. Поскольку выборка случайна и ограничена (см. п. 6), она не дает возможности получить точные (однозначные) решения этих задач. С увеличением объема выборки, как правило, повышается точность и надежность сделанных по ней выводов. При заданном объеме выборки необходимо так использовать выборочные значения, чтобы наилучшим образом ответить на поставленные вопросы. Но что значит «наилучшим образом»? Испытание статистических гипотез объединяет те задачи, в которых требуется выбрать одну из конкурирующих (альтернативных) гипотез о характеристиках генеральных случайных величин. Для этих задач «решить наилучшим образом», значит выбрать ту гипотезу, которая в некотором, заранее обусловленном смысле более правдоподобна, более надежна, более вероятна. Невозможность сделать однозначные выводы по конечной выборке в данном случае состоит в том, что какую бы гипотезу мы не выбрали, всегда есть вероятность совершить ошибку, т. е. выбрать «неверную» гипотезу.
В зависимости от того, что понимается под наилучшим выбором гипотезы, этот выбор будет производится по-разному, и, возможно, будут выбраны разные гипотезы. Поэтому решение задач испытания гипотез предполагает:
-
формулировку критерия оптимальности, отвечающего на вопрос, что значит наилучший выбор гипотезы;
-
нахождение решающего правила, т. е. алгоритма обработки выборки, приводящего к выбору гипотезы;
-
реализацию этого алгоритма по отношению к имеющейся выборке;
-
оценку степени надежности сделанного выбора.
Оказывается, что на самом деле решающее правило это всегда отнесение имеющейся выборки к определенному классу.
За исключением тривиальных случаев, не представляющих практического интереса, не существует единственно возможного критерия оптимальности: всегда можно предложить разные критерии, в том или ином отношении один лучше другого. Поэтому не существует единственного, раз и навсегда принятого наилучшего решающего правила. Принятие того или иного критерия выходит за рамки собственно математической статистики и требует учета обстоятельств предметной области, в которой она применяется.
Другое направление анализа статистических данных - получение возможно более полного статистического описания генеральной совокупности. Поскольку наиболее полными характеристиками являются распределения, конечной целью этого направления является нахождение распределения генеральной совокупности. Если вид кривой распределения установлен, то для нахождения распределения остается определить значения его параметров. Более того, часто значения параметров распределения вообще являются конечной целью анализа данных. Вследствие случайности и конечности выборки абсолютно точно эти задачи не решаются, поэтому на самом деле речь идет об оценивании (т. е. приближенном определении) распределения или параметров. Эта область анализа данных называется статистическим оцениванием. Решение задач статистического оценивания предполагает:
-
формулировку критерия оптимального оценивания;
-
нахождение оптимального алгоритма обработки, приводящего к оптимальной оценке;
-
реализацию этого алгоритма по отношению к имеющейся выборке и получение оценки;
-
определение степени точности полученной оценки.
Не всегда возможно тот или иной вопрос четко отнести к тому или иному из описанных направлений. Примером может служить рассмотренное в следующем пункте выравнивание статистических рядов, лежащее на стыке испытания гипотез и оценивания параметров.