
- •Введение в математические основы медицинской статистики
- •Составители: доц. С.Н.Киселев, доц. Л.В.Солохина, ст. Преподаватель с.В.Ципкина
- •I. Введение. Предмет медицинской статистики.
- •II. Понятие о статистических закономерностях
- •III. Основные понятия теории вероятностей
- •Заключение.
- •Контрольные задачи:
III. Основные понятия теории вероятностей
Теорией вероятностей называется математическая наука, изучающая закономерности случайных явлений.
Следует сразу же заметить, что понятие случайное явление в теории вероятностей существенно отличается от обыденного, общежитейского представления.
В обыденной жизни случайным событием считают такое событие, которое встречается крайне редко, идет как бы вразрез установившемуся порядку вещей, не может быть закономерным.
В теории же вероятностей случайные события, как они ею понимаются, обладают характерными особенностями, подчиняются строго определенным закономерностям.
Для того чтобы понять это, надо познакомиться с некоторыми основными понятиями этой науки.
а) достоверное, невозможное и случайное события.
С точки зрения теории вероятностей все события делятся на три вида: достоверное, невозможное и случайное, которые определяются следующим образом:
1) если при каждом осуществлении комплекса условий S обязательно происходит событие А, то оно называется достоверным.
Например, если химически чистую воду, находящуюся при атмосферном давлении 760 мм рт. ст. нагреть до температуры более 100°С, то она неизбежно превращается в пар.
Здесь при соблюдении комплекса условий S, включающего три элемента: химически чистая вода, нормальное атмосферное давление и нагревание до температуры свыше 100°С, всегда и обязательно наступает событие А (превращение воды в пар).
Аналогичный характер носят многие законы естественных наук.
2) Если при осуществлении комплекса условий S событие А заведомо не может произойти, то оно называется невозможным.
Примеры невозможных событий легко привести из противоположных достоверным. Например, при указанных в первом примере условиях - превращение воды в лед.
3) Случайным называется такое событие А, которое при каждом осуществлении комплекса условий может произойти, но может и не произойти.
В природе особенно в области явлений, изучаемых биологией и медициной, мы постоянно встречаемся с такого рода закономерностями.
Например, если здоровый ребенок попал в контакт с больным дифтерией (комплекс условий S), он может заболеть дифтерией (произойдет событие А), но может и не заболеть.
Надо только помнить, что говоря о достоверности, невозможности или случайности какого-либо события, мы всегда имеем в виду достоверность, невозможность или случайность его только по отношению к определенному комплексу условий.
Поэтому даже простое утверждение, что то или иное явление относится к случайным, само по себе уже имеет определенный познавательный интерес, так как указывает, что установленный нами комплекс условий S не отражает всей совокупности причин необходимых и достаточных для появления события А и, следовательно, может направить мысль исследователя на поиск дополнительных важных условий, входящих в этот комплекс причин.
Однако имеется достаточно широкий круг явлений, для которых возможна не только констатация случайности явления А, но и количественная (выраженная числом) оценка возможности (вероятности) его появления, т.е. в отношении таких событий можно утверждать, что вероятность того, что при осуществлении комплекса условии S произойдет событие А, равна р.
Такого рода закономерности называются стохастическими, т.е. вероятностными и играют большую роль в самых различных областях науки.
б) Определение вероятности.
Прежде чем перейти к определению вероятности, необходимо познакомиться с некоторыми основными понятиями и терминами теории вероятностей.
Классическое определение вероятности сводит ее понятие к понятию равновероятности (равновозможности) событий.
Например, при бросании игральной кости (шестигранного кубика), если она имеет точную форму куба, изготовленного из вполне однородного материала, выпадение любого определенного из 6-ти обозначенных на ее гранях числа очков, равновероятно (равновозможно), так как в силу наличия строгой симметрии ни одна из граней не имеет объективного преимущества перед другими.
Число, обозначающее полную группу равновозможных событий при проведении определенного испытания (в нашем примере бросание игральной кости) обозначается обычно буквой n, т.е. в нашем примере n=6.
Предположим далее, что нас интересует лишь какое-то одно из возможных событий, событие А (например, выпадение четного числа очков при бросании игральной кости).
Те из возможных результатов испытания (бросание кости), на которые это событие подразделяется, называются результатами благоприятствующими событию А, а число их принято обозначать буквой m.
В нашем примере событие А (выпадение четного числа очков) подразделяется на три возможных результата (выпадение 2-х, 4-х и 6-ти очков), т.е. m=3.
Пользуясь указанной терминологией, можно прийти к определению: «Вероятность Р(А) события А равна отношению числа возможных результатов испытания, благоприятствующих событию А, к числу всех возможных результатов испытания». Или Р(А) = m/n. Следовательно, вероятность Р выпадения четного числа очков (событие А) при однократном бросании игральной кости определится следующим образом:
P(A) = 3/6 = 1/2 = 0,5
Рассмотрим еще один пример. Допустим, что мы имеем урну, в которой находится 12 совершенно одинаковых по форме, величине, тяжести и другим признакам, шаров, но отличающихся только цветом окраски. Причем, в общем числе 5 шаров имеют красный цвет и 7 - черный.
Очевидно, что, если мы не глядя опустим руку в урну и извлечем из нее первый, случайно попавшийся шар, возможны два события: А - извлеченный шар окажется красным и В - извлеченный шар окажется черным. Какова вероятность каждого из этих событий?
Для события А (извлечения красного шара) число равновозможных результатов испытания n = 12 (в урне 12 шаров и любой из них может оказаться в руке), число же благоприятствующих событий m = 5 (так как только 5 из 12 шаров являются красными), следовательно: P(A) = m/n = 5/12.
Рассуждая аналогичным образом, находим, что вероятность события В (извлечение черного шара), равна: P(B) = m/n = 7/12.
Таким образом, вероятность того, что при указанном комплексе условий, первый наугад извлеченный из урны шар окажется черным, выше, чем вероятность извлечения красного шара.
Представим теперь случай, при котором в урне также 12 одинаковых шаров и все они одного цвета - красные.
Какова в этом случае вероятность того, что первый же наугад извлеченный нами шар окажется красного цвета.
Очевидно, что в данном случае число всех равновозможных результатов испытания равно n = 12, но и число благоприятствующих событию А (извлечение красного шара) результатов m = 12 (так как все шары красные), следовательно:
P(A) = m/n = 12/12 =1
Согласно ранее установленному определению в данном случае событие А является достоверным.
На самом деле при каждом соблюдении комплекса условий (наличие в урне одинаковых шаров только красного цвета), событие А (извлечение шара красного цвета) совершенно неизбежно и обязательно произойдет. Отсюда, мы можем утверждать, что вероятность достоверного события всегда равна единице.
И, наконец, зададимся вопросом при тех же условиях (нахождение в урне 12 шаров только красного цвета), чему равна вероятность того, что извлеченный из нее шар, окажется черного цвета (событие В)? Очевидно, что в данном случае число всех равновозможных результатов испытания n является равным 12, число же благоприятствующих событию В результатов испытания m = 0 (в урне нет ни одного черного шара). Следовательно: Р(В)= m/n = 0/12 =0.
Согласно ранее данному определению извлечение черного шара из урны, где таких шаров вообще не имеется является невозможным событием.
Следовательно, можно сделать вывод, что вероятность невозможного события всегда равна нулю. Вероятность же случайного события должна находиться, очевидно, между этими двумя крайними величинами, т.е. между нулем (вероятность невозможного события) и единицей (вероятность достоверного события), т.е. всегда представляет собою правильную дробь, которая может быть выражена и десятичной дробью, например:
Р(А)= 1/2 = 0,5.
в) Доверительная вероятность.
Оперируя понятием вероятность, всегда следует помнить о том, что как бы ни мала была вероятность какого-либо события, до тех пор пока она не равна нулю (т.е. пока это событие не является невозможным), оно все же может произойти и, наоборот, как бы ни велика была вероятность события, но пока она не равняется единице (т.е. пока событие не является достоверным) оно может и не произойти.
В популярном в свое время кинофильме «Два бойца», вышедшем на экраны в годы Отечественной войны, имеется образ профессора-математика, который в начале войны в момент объявления воздушной тревоги не ходил в бомбоубежище, так как определил, то площадь его квартиры по отношению к площади всего Ленинграда настолько мала, что вероятность того, что одна из брошенных фашистами бомб попадет именно в его квартиру, имеет ничтожное значение.
Однако после того как в Ленинградском зоопарке, во время одной из бомбежек был убит единственный в городе слон (как ни мала была вероятность этого события, оно все же случилось), профессор пересмотрел свою точку зрения и стал спускаться в убежище.
Вот почему, оперируя показателями вероятности, теория вероятностей всегда имеет в виду не столько результат единичного испытания, сколько проявление этой закономерности в массе однородных явлений, о чем уже говорилось в самом начале настоящего пособия.
Однако, в целях практического применения теории вероятностей в области математической статистики, вводится понятие доверительной вероятности, т.е. такой величины вероятности, которая достаточна для того, чтобы полученные результаты опытов считать достоверными.
Вполне понятно, что величина доверительной вероятности весьма относительна и зависит от характера явления, для которого определяется.
Например, если мы знаем, что вероятность выпуска заводом брака артиллерийских снарядов равна 0,01, то ее можно считать малой и пренебречь, так как на фронте стреляют обычно большими сериями снарядов и, если имеется вероятность, что только один из каждой сотни выпущенных снарядов может не разорваться, то это существенного значения не имеет.
Представьте теперь, что такова же вероятность брака на фабрике, выпускающей парашюты. Можно ли в этом случае считать вероятность малой и пренебречь ею? Конечно нет, ведь один из каждых ста парашютистов, воспользовавшихся парашютами этой фабрики, может разбиться. Очевидно, что в этом случае вероятность брака даже равная 0,001 будет велика и недопустима.
Несмотря на относительный характер величины доверительной вероятности в математической статистике для обычных исследований в области биологии и медицины условно приняты два ее значения:
а) Вероятность равная 0,95 — считается достаточной для суждения о достоверности полученных результатов опыта.
б) Вероятность равная 0,997 — считается еще более надежным критерием достоверности.
И, наоборот, если полученные результаты имеют вероятность соответственно менее 0,05 или 0,003, то они считаются настолько недостоверными, что ими можно пренебречь,
г) Закон больших чисел.
Как уже отмечалось в начале, математическая статистика изучает статистические закономерности, т.е. такие закономерности, которые проявляют себя лишь при исследовании массы однородных явлений.
Это положение полностью относится и к вероятности случайных явлений, где действует закон больших чисел. Математическая теория этого закона была изложена еще в XVIII веке в трудах Я.Бернулли. Последующее развитие его осуществлено в середине XIX столетия, особенно в трудах выдающегося отечественного математика П.Л.Чебышева.
В настоящее время существуют точные математические формулировки закона больших чисел. Однако мы воспользуемся более простой и поэтому более понятной для лиц, не имеющих специальной математической подготовки, формулой этого закона, которая предложена Р.Мизесом, хотя при строго математическом подходе его трактовка закона и вытекающее из него определение вероятности не достаточно точны. Закон больших чисел в этом виде может, быть представлен следующей формулой:
-
lim (Xn - Pn)
→
0
n →
т.е. в пределе при числе наблюдений (n), стремящемся к бесконечности, разность между наблюдаемой частотой какого-либо явления и его математической вероятностью стремится к нулю.
Иначе говоря, фактическая частота наблюдаемого случайного явления совпадает с вычисленной вероятностью его (их разность только при этом условии может быть равна нулю) лишь при достаточно большом числе наблюдений.
Действие этого закона может быть проиллюстрировано следующим примером. Как уже понятно из ранее изложенного, вероятность выпадения герба при бросании монеты равна Р (А) = 1/2 = 0,5, т.е. при бросании монеты в половине всех случаев должен выпадать герб, а в половине - противоположная сторона (решка). Однако легко убедиться, что, если мы бросим монеты несколько раз, то установленного результата не получим: может подряд выпасть несколько раз только герб или только противоположная сторона, либо та и другая в любых соотношениях.
В соответствии с законом больших чисел, чтобы фактическая частота выпадения герба совпала с ее вероятностью (0,5) надо значительно увеличить число наблюдений (бросаний монеты).
Такие опыты проделывались неоднократно и были получены следующие результаты. Так, в XVIII веке французский естествоиспытатель Бюффон бросил монету 4040 раз, при этом герб у него выпал 2048 раз, т.е. частота выпадения герба оказалась равной Х = 2048/4040 = 0,508; или отличалась от вероятности на восемь тысячных.
В XIX веке английский математик К.Пирсон увеличил число бросаний до 12000 и в 6019 случаях у него выпал герб. Таким образом, частота выпадения герба составила: 6019/12000= 0,5016, т.е. отличие от вероятности уменьшилось почти вдвое (до 16 десятитысячных). Затем он повторил опыт, увеличив число бросаний до 24000 и герб выпал при этом 12012 раз; т.е. частота 12012/24000 = 0,5005; отличие ее от вероятности стало еще в три раза меньше.
Таким образом, по мере увеличения числа наблюдений фактическая частота выпадения герба по величине становится все более близкой к величине его математической вероятности и, следовательно, разность между ними уменьшается, приближаясь к нулю.
Из этого следует очень важный вывод, на основании которого в ряде случаев применяется так называемый статистический метод определения вероятности.
В медицине, как и в других отраслях научного знания, мы нередко сталкиваемся с такими явлениями, при которых найти вероятность его появления обычным математическим расчетом не представляется возможным; но из изложенного ранее закона следует, что при достаточно большом числе наблюдений найденную опытным методом частоту явления можно, считать вероятностью его появления, т.е. в этом случае вероятность Р события А находится по формуле: Р(А) = M/n, где n - общее количество испытаний (наблюдений), а М - число появления при этих испытаниях интересующего нас явления А.
Например, если мы имеем группу 20000 больных, страдающих, каким-либо одним заболеванием, а у 12000 из них зарегистрирован один и тот же симптом (А), то очевидно, вероятность наличия этого симптома у каждого больного, страдающего данной болезнью, будет равна: Р(А) = 12000/20000=0,6.
Следует остановиться еще на одном замечании. Некоторые не совсем сведущие в статистике лица, исходя из закона больших чисел, полагают, что достаточно достоверные данные опытов могут быть получены только при очень большом количестве наблюдений; или, что нельзя вычислять процентами, если сумма всех наблюдений менее 100 и т.д. На самом деле это совсем не так.
Методы математической статистики позволяют определить степень достоверности явлений при любом (даже очень малом) количестве наблюдений, а также заранее рассчитать количество необходимых наблюдений, чтобы получить результаты, достоверные с заданной величиной вероятности.
В законе больших чисел проявляется диалектическая взаимосвязь категорий случайного и необходимого.
Появление каждого явления (события) зависит, с одной стороны, от действия постоянных причин, содержащихся в самой сущности этого явления (иначе говоря, внутренних для него), а с другой стороны, под влиянием случайных (внешних) причин, не связанных с самой сущностью исследуемого явления.
Действие последних причин неустойчиво и беспорядочно, они могут вызывать отклонения при малом числе наблюдений как в ту, так и в другую сторону.
При достаточно же большом числе наблюдений действие таких случайных причин, вызывающих отклонения в отрицательном и положительном направлениях, как бы взаимно погашается и частота возникновения события определяется уже лишь его внутренними (постоянными) причинами.