Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические методы в геологии лекции

.pdf
Скачиваний:
44
Добавлен:
21.08.2019
Размер:
2.58 Mб
Скачать

vk.com/club152685050 | vk.com/id446425943

Дисциплина «Статистические методы в геологии» Лекция 2

Слайд_1 Некоторые положения теории вероятности

Первичными понятиям в теории вероятностей являются:

Событие – результат опыта или естественного явления, который может быть получен или не получен при данных условиях

Вероятность – является количественной мерой возможности события при данных условиях.

Если наступление события при данных условиях исключено, то такое событие является невозможным и ему приписывается вероятность равная нулю.

Если событие при данных событиях обязательно наступает, то его называют достоверным и его вероятность равна единице.

Если же событие при данных условиях может наступить, а может и не наступить, то оно называется вероятным и тогда говорят, что оно может произойти с некоторой вероятностью.

Вероятность (Р) наступления некоторого конкретного события прямо пропорциональна числу испытаний-числу испытаний благоприятных для события (тех, при которых оно наcтупает) и обратно пропорционально числу всех равновозможных случаев (благоприятных и неблагоприятных)

Р=m/n

Где m –благоприятные, n-равновозможные

Слайд_2

Основные свойства вероятности

Свойство 1.

Если а,b,........k представляют собой полный набор взаимоисключающих событий, совместно исчерпывающих вероятность и Ра - вероятность события а, то

Ра+Рb+.....+Pk =1 - вероятность любого исхода; Pa=1 - ( Рb+Pc+.....+Pk) -вероятность события а;

P1 = 1 - Р =Pb+Pc+.....+Pk - вероятность не события а.

Свойство 2.

Если а,b,........k есть множество взаимоисключающих событий, то вероятность того, что наступит хотя бы одно из них, выражается суммой отдельных вероятностей:

Pa или b = Pa+Pb

Свойство 3. Для любого числа событий a,b,c,.........k, если они независимы, вероятность их одновременного или последовательного наступления равнj произведению их вероятностей:

Pa и b и с ......и k = Pa*Pb*Pc*......Pk

Свойство 4.

vk.com/club152685050 | vk.com/id446425943

Если события не взаимоисключающие, то верятность наступления хотя бы одного событий а или b равна

Pa или b = Pa+Pb-Pa*Pb

Слайд_3

Определение случайной величины Существует несколько определений случайной величины.

Например: "Под случайной величиной эпсилон поразумевается такая величина,

которая в результате единичного эксперимента принимает то или иное заранее неизвестное значение".

Или "под случайной величиной понимается случайный эксперимент с числовым исходом".

В геологии случайная величина является удобной математической моделью для формального представления различных геологических характеристик (содержание литопипов в породах, мощностей, глубин, значений характеристик ФЕС пород-

коллекторов и др.)

Слайд_4 Понятия выборки и совокупности

Главная проблема в геологии - необходимость делать выводы на ограниченном

числе наблюдений. То есть исследователь работает не со всем объектом исследования, а с некоторыми выборочными данными, на основе которых вынужден судить об особенностях объекта в целом.

Всвязи с этим следует четко понимать различия между весьма распространенными

встатистике терминами: генеральная совокупность и выборка.

Генеральная совокупность - это максимальное, теоретически возможное число

наблюдений на объекте, по идее, характеризующее истинное положение вещей.

Более точное определение: генеральная совокупность - это полное множество

возможных значений случайной величины.

Предположим, что перед нами стоит задача выяснить средний размер галек на сочинском пляже (размер гальки в данном случае является случайной величиной, так как результат измерений любой отдельно взятой гальки заранее неизвестен). Для точного ответа на данный вопрос нам, по идее, необходимо собрать абсолютно все гальки на пляже, измерить размер каждой, просуммировать и поделить на их число. Мы получим практически истинную цифру, на которую могут повлиять разве что ошибки при наших измерениях или при подсчет общего числа галек.

Подойдем к решению этой задачи с противоположной стороны. Возьмем всего одну гальку и измерим ее размер. Понятно, что судить по размерам одной гальки о всем пляже практически невозможно ( хотя существует не равная нулю, но близкая к нему, вероятность, что мы взяли именно ту гальку, размер которой будем соответствовать полученному первым способом).

Логичнее взять не одну, а, например, 100 или 1000 галек и на них произвести необходимые измерения. Понятно, что чем больше галек мы возьмем, тем ближе будет наш результат к истинному. Правда, плата за это будет трудоемкость и время,

vk.com/club152685050 | vk.com/id446425943

потраченное на измерения. И самое интересное, что скорее всего, после определенного числа галек (например, после 150) результаты средних значений будут отличаться друг от друга где-нибудь в пятом-шестом знаке после запятой. Поэтому, для получения вполне

устраивающего по точности результата, в таком случае зачастую достаточно отобрать (выбрать) из имеющихся на пляже миллиона галек штук 100 и их измерить.

Тогда эти 100 штук будут называться выборкой (выборкой из генеральной совокупности. Иногда наряду с термином "выборка" употребляется термин "выборочная совокупность".

Таким образом, если генеральная совокупность - это полная совокупность всех возможных значений изучаемой величины, то выборка - это ограниченная совокупность

случайных значений изучаемой величины.

Слайд_5

Требования в выборке

Для того, чтобы выборка корректно представляла генеральную совокупность, она должна отвечать четырем основным требованиям:

-массовость, -однородность, -случайность -независимость

Слайд_6

Требования в выборке

Массовость (объем выборки) - это достаточное количество проб или

наблюдений, необходимое в связи с тем, что большинство статистических закономерностей проявляются только в массовых явлениях. Строго говоря, четкого математического аппарата для выявления необходимого количества проб до сих пор не разработано, но эмпирическим путем установлено, что надежность статистических оценок резко снижается при уменьшении объема выборки в диапазоне от 60 до 30-20

наблюдений, а при меньшем количестве измерений применять статистически еметоды в большинстве случаев вообще не имеет смысла.

Слайд_7

Однородность.

Выборка должна состоять из наблюдений, принадлежащих обному объекту и выполненных одинаковым способом, т.е. при постоянном размере проб и методе анализа и измерения.

Слайд_8

Случайность

Результат выборочного единичного наблюдения должен быть непредсказуем, как бы это не звучало странно. В этом плане подавляющее большинство геологических объектов вполне удовлетворяет этому требованию в силу своей сложности и

vk.com/club152685050 | vk.com/id446425943

изменчивости, но математически это требование выполняется лишь тогда, когда расположение места отбора проб или замера какого-либо признака не связано с

величиной, характеризующей это свойство.

При серьезных геологоразведочных работах условие случайности обычно достигается за счет проведения наблюдений по равномерной сети. На наиболее перспективных и интересных участках часто возникает необходимость сгущения сети опробования. Многие характеристики на подобных участках зачастую могут отличаться от особенностей площади в целом и при статистической обработке их необходимо выделять в отдельную совокупность.

Слайд_9

Независимость

Независимость предполагает, что результаты каждого наблюдения не зависят от результатов предыдущих и последующих наблюдений, а при проведении наблюдений на площади или в объеме результаты не зависят от координат пространства.

При соблюдении всех вышеперечисленных правил выборка может называться

представительной.

Слайд_10 Функция распределения и основные параметры случайной величины

Соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями называется законом распределения или функцией распределения случайной величины.

Наиболее существенные особенности распределения случайной величины могут быть выражены с помощью числовых характеристик положения и разброса.

Если речь идет о характеристиках генеральной совокупности, то их принято называть параметрами (параметрами генеральной совокупности).

Если же объектом изучения и расчетов является выборка из генеральной совокупности, то эти характеристики принято называть статистиками (выборочными статистиками).

К характеристикам положения относятся: математическое ожидание, мода и медиана.

Слайд_11

Характеристики положения случайной величины. Математическое ожидание

Математическое ожидание (µx) -это ожидаемое истинное значение измеряемой величины. Например, это тот самый результат измерения ВСЕХ галек на пляже. На практике, обычно, это недостижимый результат, примерно такой де, как и предел функции.

vk.com/club152685050 | vk.com/id446425943

Строгое определение математического ожидания представляет собой сумму произведений некоего конкретного значения случайной величины на соответствующему этому значению вероятности его появления:

µx = (Xi*Pi)

для дискретных величин

или

 

µx=X*f(x)dx

для непрерывных величин

Вполне адекватной заменой математическому ожиданию является среднее арифметическое значение случайной величины:

Xср=(сумм(Xi))/n

Существуют различные варианты вычисления средних значений (среднее арифметическое, среднее геометрическое, среднее логарифмическое, среднее гармоническое и др.).

Необходимо понимать, что, несмотря на стремление среднего к математическому ожиданию, оно не всегда достижимо и, как следствие, не всегда максимально правдоподобно, например, в случае резко асимметричных распределений (например, логнормальных).

Слайд_12

Характеристики положения случайной величины. Мода

Мода (М0) случайной величины указывает на ее наиболее вероятное значение, т.е. наиболее часто встречающееся в выборке значение (для дискретной величины) или значение которому соответствует точка максимума на графике плотности вероятности (для непрерывной величины). Если распределение имеет два или более максимумов, то такое распределение называется полимодальным. В большинстве случаев это свидетельствует о неоднородности выборки и требует внимательного обращения с исходными данными (например, разделения на подвыборки).

vk.com/club152685050 | vk.com/id446425943

Слайд_13

Характеристики положения случайной величины. Медиана

Медиана (Ме) случайной величины указывает на ее среднее с вероятностью 0,5, т.е. такого значения, относительно которого вероятности встретить большие или меньшие значения равны.

P(x<Me) = P(x>Me)

Фактически, медиана, как ей и положено в геометрии, делит множество возможных значений пополам. Поэтому при относительно небольшом числе наблюдений медиану определить очень просто, достаточно расположить все наши данные в порядке возрастания или убывания и посмотреть, какое значение находится в середине этого ряда.

В общем случае, математическое ожидание (среднее) мода и медиана случайной величины имеют различные значения. Но для симметричных распределений они могут совпадать( что часто используется для оценки закона распределения).

Слайд_14

Характеристики разброса случайной величины

Главной характеристикой разброса значений случайной величины является

дисперсия.

Дисперсия - это мера отклонения значений от среднего. Така как отклонения в большую (положительные) и меньшую (отрицательные) сторону от среднего равновероятны, то из арифметическая сумма может оказаться равной нулю, независимо от размаха отклонений. Во избежании этого для оценки дисперсии пользуются квадратами отклонений.

Дисперсия генеральной совокупности:

Дисперсия выборки:

Слайд_15

Характеристики разброса случайной величины Стандартное отклонение

На практике наиболее наглядным является квадратный корень из дисперсии - стандартное отклонение. Стандартное отклонение генеральной совокупности:

vk.com/club152685050 | vk.com/id446425943

стандартное отклонение выборки:

Свойства дисперсии:

Слайд_16

Характеристики разброса случайной величины Коэффициент вариации (V)

Для генеральной совокупности

vk.com/club152685050 | vk.com/id446425943

для выборки:

Слайд_17

Характеристики разброса случайной величины Ассиметрия

Ассиметрия распределения значений случайной величины служит мерой скоса (асимметричности) кривой распределения плотности вероятности

А<0

vk.com/club152685050 | vk.com/id446425943

Слайд_18

Характеристики разброса случайной величины Эксцесс

vk.com/club152685050 | vk.com/id446425943