В статистике это формулируется так: выборка должна быть представительной, т. е. давать возможность правильно судить о свойствах генеральной совокупности. Поэтому необходимо рассмотреть вопрос о том, насколько данные, получаемые по выборке, соответствуют генеральной совокупности.
Рассчитываемые по результатам выборочных измерений числовые характеристики не совпадают в точности с соответствующими характеристиками генеральной совокупности. Кроме того, они- величины случайные, так как случаен сам отбор измеряемых объектов. Две выборки из одной и той же генеральной совокупности дадут несколько различающиеся значения числовых характеристик. Выборочные характеристики являются не точными значениями, а оценками характеристик генеральной совокупности; если источник случайности-ошибки измерений, то считают, что значения выборочных характеристик являются оценка- м и и с т и н н ы х з н а ч е н и и.
Чтобы традукция оказалась правильной и по выборочным измерениям можно было верно судить о свойствах генеральной совокупности, рассчитываемые оценки должны обладать рядом свойств. Не давая строгих определений, укажем практический смысл этих свойств. Первое свойство--состоятельность. Состоятельной является оценка, которая при увеличении объема выборки сходится ê генеральному значению: чем больше измерений, тем точнее характеризует наша оценка истинное значение, и при очень большом их числе оно может быть оценено со сколь угодно высокой точностью.
Второе свойство-несмещенность. Несмещенная оценка при небольшом числе измерений может, разумеется, заметно отклоняться от оцениваемой величины, но в среднем она ей равна. В отличие от нее, смещенная оценка при малом числе измерений систематически отклоняется от оцениваемой величины (завышена или занижена), хотя при увеличении объема выборки может и стремиться к истинному значению, т. е. быть состоятельной. Несме- щенность оценок очень важна в химии и химической технологии, где чаще всего эксперимент дорог и желательно работать с малыми выборками.
Наконец, третье свойство оценок-эффективность: эффективная оценка точнее, чем любая другая оценка той же характеристики, полученная по той же выборке. На практике иногда приходится пользоваться оценками, не обладающими всеми этими свойствами (разумеется, если несостоятельность, смещенность и неэффективность достаточно малы); но этого желательно по возможности избегать. Подробнее и строже требования к оценкам изложены в книгах [7, 20]. 1
Оценкой математического ожидания ЛГ*) случайной величины 1 X является с р е д н е е а р и ф м е т и ч е с к о е 1
*=* (6.1) 1 58 1
Нетрудно заметить, что формула (6.1) полностью аналогична выражению (5.9). В подавляющем большинстве случаев эта оценка-состоятельная, несмещенная и эффективная.
Если теперь построить оценку дисперсия аналогично формуле *5.11)
*..*.. (Õ1 - ** + (Õ* --* + + (Õï -*
то она окажется, хотя и состоятельной, но смещенной: при малых выборках она занижена.
Несмещенная оценка дисперсии, обычно обозначаемая 5'' и называемая выборочной дисперсией, отличается знаменателем
*°-(*-*)'+(*-* +(*-* (62)
В этой формуле величину п-1 называют ч и с л о м с т е п е н е и с в о б о д ы } /=ï-1 (6.3)
В статистике число степеней свободы определяют как общее число измерений за вычетом число, оценок, уже рассчитанных по этим измерениям и применяемых при расчете рассматриваемой характеристики. В данном случае уже рассчитана и используется в формуле (6.2) величина õ, поэтому ! на единицу меньше, чем ï.
Выборочное среднее квадратическое отклонение 5 рассчитывается так же, как î
ä == ** (6.4)
Оценка (6.4) - немного смещенная, но обычно смещение учитывается не поправкой к величине .5, а соответствующими формулами, в которых эта величина используется.
В ы б о р о ч н ы и к о э ф ф и ц и е н т к о р р е л я ц и и г определяется формулой
(*
Ò = -* 5 Ó!(Õ1-*)*+··+(Õï-*)*\*(Ó1-Ó)'++(Óï-¹?*
*¹1-*)(Ó1-Ó)**
= * (*·*)
* *(****à-?)'' * 1=1 1==1
Здесь рассматриваются ï объектов, причем каждый 1-тый объект
.характеризуется значениями õå è óã, õ и */-средние значения õ è ó по всем объектам.
59
11 -