Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ekzamen_mat_metody

.doc
Скачиваний:
85
Добавлен:
24.02.2016
Размер:
216.58 Кб
Скачать

Вопрос№1: *История математической статистики Период накопления знаний: 17 - 19 века .Период формирования науки: первая треть 20 века .В первой трети 20 века разработаны параметрические методы математической статистики, использующие теорию вероятностей и свойства статистических законов распределения. Во второй трети 20 века разработаны непараметрические методы, применение которых не требует использования статистических законов распределения. В последней трети 20 века развитие получили методы планирования, проведения эксперимента и интенсивного использования ЭВМ . *Размерность данных в математической статистике: 1)Одномерный статистический анализ - исходные данные - действительное число 2)Двумерный статистический анализ - исходный результат описывается двумя числами 3)Многомерный статистический анализ – результат наблюдения над объектом характеризуется тремя и более числами 4)Статистический анализ случайных процессов и временных рядов - результат наблюдения – функция *Проблемы математической статистики :1)Увеличение адекватности моделей данных в прикладных ;геологических исследованиях;2)Развитие методов статистического анализа с интенсивным использованием компьютерной обработки данных;3)Разработка методов анализа многомерных данных и улучшение визуализации его результатов;4)Создание методов обработки «гигантских» массивов информации; Обработка данных геологического и экологического мониторинга.

Вопрос№2: Используемые в геологии шкалы измерения. Качественные: номинальная, порядковая; количественные: интервальная, относительная.( относительная – самая информативная). В номинальной шкале числа, приписываемые объектам указывают только на различие или сходство этих объектов. В порядковой шкале числа, приписываемые объектам упорядочивают эти объекты по какому-либо признаку, но указывают только на порядок размещения объектов на шкале, а не на расстоянии. В интервальной шкале числа, приписываемые объектам указывают на порядок объектов и на расстояние между ними. Она не имеет естественного нуля. В относительной шкале существует истинная нулевая точка.

Вопрос№3:Математическая статистика. Выборка и генеральная совокупность. Математическая статистика – наука о математических методах использования статистических данных для научных и практических выводов. Опирается на теорию вероятности и понятия о законах распределения случайных величин. Основная задача: на основании выборки сделать существенный вывод о генеральной совокупности, и о любой выборке которая может быть из нее извлечена. Статистика позво­ляет распространить выводы, полученные по ограниченному числу наблюдений (выборке), на весь объект (совокупность). Мат. Статистика включает: а) одномерный статистический анализ (результат 1 число) б) двумерный статистический анализ (результат 2 числа) в) Многомерный статистический анализ (результат 3 или более числа)Генеральная совокупность – математическая абстракция, означающая множество всех значений случайной величины или множество результатов всех мыслимых наблюдений. Генеральная совокупность случайных величин в геологии может быть конечной или бесконечной . Выборка – множество наблюдаемых значений случайной величины.

Выводы и заключения, сделанные на основании выборки, всегда имеют случайный характер, однако они могут быть в большей или в меньшей степени распространены на всю сово­купность, т. е. на изучаемое явление в целом. Методы матема­тической статистики обеспечивают возможность наилучшего использования выборочной информации для по­лучения наиболее надежных результатов и для определения степени надежности полученных выводов.

Вопрос №4: Требования к выборке: Случайность, однородность, независимость, учет симметрии распределения. Несоответствие приводит к недостоверным результатам. Выборка проводится случайно, если любая из возможных выборок заданного объекта n и совокупности объема N имеют одинаковую вероятность быть выбранными. Выборка должна состоять из наблюдений 1-го объекта и эти наблюдения должны быть выполнены одинаковым способом. Независимость: случайные величины X,Y называются независимыми, если для любых 2-х интервалов D1 и D2 события, заключающиеся в том, что значение X принадлежит D1, а значение Y принадлежит D2, независимы.

Вопрос№5:Модели в геологии. Детерминированные и статистические системы. Геометрические, физические, понятийные, математические модели. Моделирование представляет собой метод исследования строения слож­ных природных объектов, динамики процессов или основных особенностей систем. Понятие модели в настоящее время весьма обширно. Это могут быть подобия предметов в измененном или натуральном масштабе (физическое или объемно-макетное мо­делирование), чертежи (графическое моделирование), символы или формулы (математическое моделирование), воспроизводя­щие свойства интересующих нас объектов. Модель обеспечивает лишь приб­лиженное представление о строении объекта (или о динамике изучаемого процесса). При этом любая, даже самая совершен­ная модель позволяет судить не о всех, а только о тех свойствах системы, для изучения которых осуществлялось моделирование. Объектами моделирования могут быть отдельные участки земной коры, а также различные свойства природных геологических образований — пород, минералов, полезных ископаемых, подземных вод или газов. В процессе моделирования познаются те свойства их строения, знание которых необходимо для реше­ния научных и практических задач. Моделированию могут быть подвергнуты и процессы, происходящие (или происходив­шие) в земной коре. Результат такого рода моделирования способствует выявлению условий формирования минералов, тор­ных пород и полезных ископаемых в недрах, обеспечивая на­учную основу геотектоники, петрографии и теории рудообразования. Физические (химические или физико-химические) модели процессов, происходящих в земной коре, используются в экспе­риментальной геотектонике, петрографии, геохимии и в других науках о земле. Отражают подобие форм геомет­рических соотношений и происходящих в них физических про­цессов. Графические, особенно горно-геометрические модели, широко используются в геологии и в горно-маркшейдерском деле. Представляют собой объек­ты, которые дают внешнее представление, часто служат для демонстрационных целей Горно-геометрические графики, планы и карты составляются с применением способа изолиний. Модели в изолиниях признака отражают морфологические свойства и внутреннее строение изу­чаемых объектов, а также особенности пространственного размещения изучаемых свойств. Методы горно-геометрического моделирования с помощью изолиний изучаются в курсах топо­графии, маркшейдерии и геометризации недр.

Понятийные модели являются мыслимым образом природных явлений. Основаны на наблюдениях, служат для выражения изучаемого явления в идеализированной форме, отвечают существующему уровню знаний. Чаще всего каче­ственные, помогают при проверке конкурирующих гипотез. Математические модели также используются при изучении свойств, морфологии и строения геологических образований. В качестве математических моделей используются символы и формулы, описывающие количественные взаимосвязи и законо­мерности распределения изучаемых геологических признаков. .Пред­полагается лишь тождественность математического описания процесса (явления) в оригинале и математической выраже­нии.

Вопрос №6: Дискретные и непрерывные случайные величины. Понятие интегральной и дифференциальной функции распределения случайной величины. Основные статистические параметры случайной величины. Под случайной величиной понимается случайный эксперимент с числовыми исходами. Случайная величина, принимающая в испытаниях только определенные числовые значения, называется дискретной(прерывистой), так как эти величины могут выражаться только целыми числами. Может задаваться таблично, графически, аналитически. Непрерывная случайная величина может принимать в заданном интервале любые значения, может быть любым от нуля до величины содержания свинца в чистом галените. Функция распределения представляет собой наиболее полную характеристику случайной величины, так как устанавливает связь между возможными значениями случайной величины и соответствующими им вероятностями. Интегральная функция распределения F(x) выражает вероятность того, что выборочное значение случайной величины окажется меньше некоторого предела, ограниченного x.

Дифференциальная функция распределения( функция плотности распределения f(x) характеризует вероятность попадания выборочного значения случайной величины в заданный интервал от x до x+∆x.

Вопрос№7:Биноминальное распределение и его использование в геологии. Используется в статистике для описания таких явлений или объектов, при изучении которых в результате каждого испытания может произойти либо собы­тие А, либо событие В.  

Совокупность вероятностей Рn(х) при х =0, 1, 2,.., n называется биномиальным распределением. Сумма всех возможных значений Рn(х) равна 1. Величина  называется биномиальным коэффициентом, а величины n и р - параметрами биномиального распределения. Биномиальные коэффициенты могут быть  вычислены по формуле:

  Используется в качестве математической модели для определения процентного содержа­ния зерен определенных минералов в шлихах, для оценки, коэф­фициента рудоносности залежей, показывающего, какая часть объема залежи сложена кондиционными рудами.

Вопрос№8:Нормальное распределение и его использование в геологии. Распределение вероятностей случайной величины х - называется нормальным, если оно имеет плотность вероятности. Считается, что нормальное распределение широко распространено в природе, но в то же время наблюдается существенное отклонение от него. Нарушается требование равномерной малости, независимости факторов.

Нормальное распределение определяется 2 параметрами Mx и .Кривая плотности нормального распределения f(x) симметрична относительно математического ожидания (оси ординат), проходит через точку x=Mx, и имеет в этой точке единственный max 1/. Функция F(x) нормального распределения: Мода, медиана и математическое ожидании для нормального распределения сов­падают. Нормальное распределение возникает, когда случайная ве­личина может рассматриваться как сумма очень большого числа независимых случайных величин, влияние каждой из ко­торых на эту сумму является равномерным и малым. Нормаль­ному закону следуют распределения случайных ошибок измере­ний химических и спектральных анализов, измерений объемного веса, плотности, пористости и влажности, распределение наб­люденных мощностей геологических тел и реже содержаний минералов и элементов. Свойства: 1) С уменьшением стандартного отклонения  кривя f(x) становится все более и более островершинной 2) Изменение Mx при постоянном  не меняет форму кривой, а лишь смещает ее по оси абсцисс. 3) Площади заключенные под кривой норм распределения всегда равно 1.

Вопрос№9:Логнормальное распределение и его использование в геологии. Распределение вероятностей случайной величины х - называются логнормальными, при котором логарифмы этой величины распределены нормально. Пусть -случайная величина, распределенная нормально параметрами M и 2, =lnx Тогда распределение величины -нормальное с плотностью вероятности :

: Функции плотности такого распределения. Появление логнормального распределения объясняется пропорциональным эффектом при котором приращение массы элемента в каждый момент пропорционально величине импульса и значению массы элемента в предшествующий момент. Во многих случаях распределения содержаний редких и малых элементов с содержаниями менее 1 % удовлетворительно приближаются логнормальным распределением, но не найдены теоретические обоснования именно такого характера природных распределений элементов. Логнормальное распределение в природе. Концентрации отдельных элементов в породах и рудах достигают десятков процентов. При смещении среднего значения в сторону больших значений возникают отрицательно асимметричные распределения - зеркальные отображения логнормальных. Отраженные логнормальные распределения могут характеризовать содержания: • Fe в богатых железных рудах • СаО в известняках • К и Na в залежах каменных солей • Al2O3 в высококачественных бокситах Такие распределения преобразуются в обычные логнормальные вычитанием изучаемой случайной величины Х из константы С. За константу принимается максимальное содержание данного элемента. Распределение значений η=lg(C-X) будет нормальным Нормальное, логнормальное и отраженное логнормальное распределения качественно характеризуют все возможные типы симметричных и асимметричных унимодальных

распределений и могут преобразовываться в нормальное распределение.

Вопрос№10:Распределение Пуассона и его использование в геологии. Если число испытаний велико, а вероятность появления очень мало, то для описания вероятности того что событие а произойдет х раз используют распределение Пуассона. Функция распределения вероятностей Пуассона: где m — число появлений события, принимающее значения О, 1, 2, ..., n раз;  — параметр распределения, равный произве­дению числа испытаний на вероятность появления события при отдельном испытании; Pm — вероятность то­го, что событие появится m раз. Для практического пользо­вания имеются таблицы значений Рm при различных значе­ниях .Свойства: 1) М(m)= , то есть математическое ожидание случайной величины, распределенной по закону Пуассона, равно пара­метру распределения . 2) D(m)= , то есть дисперсия числа появлений события равна параметру распределения . Чем больше , тем боль­ше рассеяние случайной величины. В случае установления соответствия распределения геол. признака закону Пуассона может быть оптимизирован объем проб для обнаружения с заданной вероятностью золота, алмазов и др. полез. ископаемые.

Вопрос№11:Выборка значений случайной величины. Требование к выборке. Геологические примеры последствий нарушений требований к выборке. Результаты химического анализа пород по профилю, замеры физических свойств образцов керна, характеристики пара­метров раковин и т. п. данные представляют собой выборки из генеральных совокупностей, характеризующих явление в целом. В общем случае имеем: x1, х2, ..., хn — независимые наблюдения (слу­чайные величины), одинаково распределенные по закону F(t)=P{xi< t}, при i==l, 2..... n. Задача геолога, использу­ющего статистические методы обработки информации, заклю­чается в том, чтобы по свойствам исследуемого признака в выборке сделать (с определенной вероятностью) заключение о его свойствах в генеральной совокупности. На основе выборки при построении диаграмм функции плотности распределения f(x) – полигоны. При построении диаграмм функции F(x) по y откладываются накопленные частости, по x центры интервалов группирования.Тре­бования:1. Выборка должна быть представительной, то есть необ­ходимо, чтобы объекты выборки правильно представляли изу­чаемую совокупность. Представительство выборки обеспечи­вается случайным отбором объектов генеральной совокупно­сти, то есть таким отбором, при котором каждый объект име­ет равные шансы попасть в выборку.2. Выборка должна быть достаточной по объему. Опреде­ление числа наблюдений, необходимого для получения обос­нованных выводов, — одна из главных задач, с которыми приходится иметь дело геологу при использовании математи­ческих методов. Если оно будет недостаточным, результаты могут оказаться неопределенными. 3. Случайность (если выбор производится случайно, то выборка будет отражать правильно свойства всей совокупности).4. Однородность (выборка должна быть выполнена одинаковым способом и состоять из наблюдений с одного объекта) 5. Независимость 6. Учет симметрии распределения .Объективность интерпретации статистических данных во многом зависит от организации их получения. Направленность отбора может обусловить появление систематических ошибок. Непонимание этого часто порождает сомнения в эф­фективности статистических методов. Несоответствие этим требованиям приводит к недостаточным результатам статистической обработки данных.

Вопрос№12:Ряды распределения выборочных данных, разновидности, цели и способы из составления и изучения. Частоты и частости. Гистограммы и кумуляты. Основная цель статистики заключается в том, чтобы получить достоверную информацию о генеральной совокупности по имеющейся из нее выборке значений. Для достижения этой цели часто предварительно составляют ряд распределения.  Этот ряд используется для графических построений с помощью которых предварительно высказывается предположение о законе распределения значений случайной величины. Графические построения на основе ряда распределения помогают оценить однородность выборки - наличие или отсутствие в ее составе значений случайной величины другого, не изучаемого при данных исследованиях,  геологического объекта. Неоднородность выборки предполагается при существовании в значениях случайной величины  нескольких максимумов. В результате отбора данных получают n значений признака. Основой для изучения выборочной совокупности является ряд распределения — упорядоченная совокупность значений при­знака и соответствующие им частоты x1, x2 …. n1, n2 …. nk где n1+ n2++nk=n – объем выборки. При статистической обработ­ке наряду с основным рядом распределения используют пре­образованные ряды:1)Ряд, в котором вместо ча­стот n1 используют частости (=n1:n). 2)Ряд с накопленными частотами Ni, где Ni = n1 + n2 + ... +ni — сумма частот от первой до i — включительно. Иногда составляют ряды накопленных частостей: ряды, в которых вместо значений признака берут отклонения этих значений от среднего и т. п. Для изучения рядов используют также их графическое изображение. Если по оси абсцисс откладывать значения х, а по оси ординат — частоты ni то каждой паре xi, ni на плос­кости будет соответствовать одна точка. Соединив такие точ­ки, получим график ряда распределения — полигон. Иногда строят график другого вида — гистограмму. Графическое изображение ряда удобно наглядностью, но не дает возможности исследовать распределение изучаемого признака полностью, решать вопросы сходства — различия сравниваемых данных. Наиболее удобным и полным являет­ся аналитический способ исследования ряда, состоящий в том, что устанавливают числовые показатели (статистики): среднее значение, дисперсию, среднее квадратическое откло­нение, показатели асимметрии, эксцесса и др., изучают функ­цию накопленных частот. Число появлений события в серии испытаний называется его частотой, а отношение числа появлений события к общему числу опытов в серии — его частостью. При увеличении числа опытов (объема выборки) частость событий сходится по вероятности к его вероятности.

Вопрос№13:Числовые показатели (статистики) выборка для группированных и не группированных данных. Смещенные, не смещенные, максимально-эффективные оценки статистических параметров.В практике геологических исследований особенно часто воз­никает необходимость статистической оценки средних значений случайных величин и их дисперсий (коэффициентов вариации).Эти числовые характеристики используются: — в качестве классификационных признаков для разделения геологических объектов на группы. — при оценках месторождений и подсчетах запасов руд. — для оценки инженерно-геологических свойств грунтов и пород при строительстве промышленных объектов и сооружений — для определения величин возможных ошибок при расчетах средних значений свойств геологических объектов по выбороч­ным данным, определения числа наблюдений для вычисления средних значений с наперед заданной точностью. Точечные оценки должны удовлетворять требованиям: Состоятельной называется оценка, сходящаяся по вероятно­сти к оцениваемому параметру с увеличением размера выборки. Несмещенной называется оценка, математическое ожидание которой равно оцениваемому параметру при любом размере выборки (т. е. не имеющая систематической ошибки). Максимально-эффективной называется оценка, обладающая минимально возможной дисперсией (минимальной случайной ошибкой) при данном числе наблюдений.

Вопрос№14:Методы моментов и максимального правдоподобия. Точечные и интервальные оценки средних значений и дисперсий. Доверительные интервалы и их расчет, уровень значимости, ошибки первого и второго рода 1)Статистическая оценка методом моментов Метод моментов заключается в приравнивании определённого

числа выборочных моментов (среднего, дисперсии и т .д.) к соответствующим моментам теоретического распределения и решении полученных уравнений относительно этих параметров. Статистические оценки, найденные при его использовании не являются асимптотически наилучшими .Более важным является метод максимального правдоподобия, который приводит к оценкам, при некоторых общих условиях асимптотически наилучшим. Частным случаем метода максимального правдоподобия является

метод наименьших квадратов. 2) Метод максимального правдоподобия в его современном виде был предложен английским статистиком Р. Фишером (1912) .В частных формах метод использовался К. Гауссом. В 18 веке к его идее были близки И. Ламберт и Д. Бернулли. В качестве оценки выбирается то значение параметра, при которых данные результаты наблюдений наиболее вероятны. Использование метода максимального правдоподобия: Метод максимального правдоподобия часто является наилучшим .Можно утверждать, что если для параметра Θ существует несмещенная эффективная оценка Θ* по выборке объёма n, то уравнение правдоподобия имеет единственное решение Θ=Θ* .Метод обобщается на случаи нескольких неизвестных параметров и для выборок из многомерных распределений .Метод статистических оценок существенно дополняется оцениванием с помощью доверительных границ.

Точечные и интегральные оценки средних значений и дисперсий. Статистические оценки могут быть точечными или интерваль­ными. При точечной оценке неизвестная характеристика случайной величины оценивается некоторым числом, а при интервальной оценке указывается некоторый интервал значений, в пределах которого с заданной вероятностью должно находиться истинное значение оцениваемой величины. Точечные оценки должны удовлетворять требованиям состоя­тельности, несмещенности и максимальной эффективности. Требования к точечной оценке: а) несмещенность б) состоятельность в) эффективность Точечная оценка не содержит информации о точности полу­ченного результата. Чем меньше выборка и чем выше изменчи­вость признака, тем большей может оказаться ошибка определе­ния точечной оценки средней. Поэтому в условиях малых выбо­рок желательно знать тот интервал значений признака, в который с заданной вероятностью попадет истинное среднее зна­чение изучаемого признака. Для получения интервальной оценки по ограниченному количеству наблюдений необходимо распо­лагать данными о функции статистического распределения выборочных точечных оценок. Проверяемая гипотеза принимается, если значение К, вычис­ленное через выборочные значения величин х1, x2, ..., хn, окажется меньше или больше (в зависимости от формулировки гипотезы) теоретического значения К для аналогичных условий и заданной вероятности р, которое берется по известному рас­пределению.

Доверительные интервалы и их расчет, уровень значимости, ошибки первого и второго рода. Проверяемая гипотеза принимается, если значение К, вычис­ленное через выборочные значения величин х1, x2, ..., хn, окажется меньше или больше (в зависимости от формулировки гипотезы) теоретического значения К для аналогичных условий и заданной вероятности р, которое берется по известному рас­пределению. Вероятность р при этом соответствует уровню ве­роятности практически невозможного события и называется уровнем значимости. Соответственно вероятность (1—р), определяющая область, в пределах которой правильность принятого решения будет практически достоверным событием, называется доверительной вероятностью.

Интервал значений, в пределах которого с заданной вероятностью находится истинное значение среднего (доверительный интервал):

P(©-α)≤ ©≤(©+α)=1-α .Ошибка, заключенная в непринятии гипотезы, в действитель­ности являющейся справедливой, называется ошибкой первого рода, а принятие ложной гипотезы — ошибкой второго рода. Если вероятность ошибки 2 рода - , то вероятность отсутствия ее =1 -  и называется мощностью данного статистического критерия.

Вопрос№15:Определение необходимого объема выборки с учетом допустимой абсолютной и относительной ошибок. Примеры использования в геологии. Абсолютная ошибка – разность между истинным и приближенным значением тела. Относительная – отношение абсолютной ошибки к истинному значению тела. Необходимый объём выборки вычисляется по формуле:

где n - необходимый объем выборки, t- величина критерия Стьюдента, λ - абсолютная ошибка определения среднего (в нашей задаче λ = 0,1 или 0,2). При малом объеме выборки (n<60) величина t зависит от n, поэтому для решения обратной задачи используется способ последовательного приближения. Первоначально в формулу подставляется значение распределения Стьюдента t для     .Если полученное n1 окажется меньше 60, в формулу подставляется значение t для полученного n1, и эта операция повторяется до тех пор, пока полученное в результате очередного расчета значение, не совпадет с величиной ni-1, принятой для определения t при ее расчете.

Вопрос №16. Дисперсионный анализ. Понятие и геологические задачи. Однофакторный дисперсионный анализ, понятия о двух- и многомерном анализе.

Раздел статистики, изучающий влияние факторов на из­менчивость случайной величины, называется дисперсионным анализом. Задача его — выделить те факторы и их сочета­ния, которые оказывают существенное влияние на изменение изучаемой величины.

Суждение о влиянии определенного фактора или комбинации факторов на изменчивость изучаемой случайной величины основано на группировке ее замеров по факторам и их уровням и проверке гипотезы о равенстве дисперсий, обусловленных данными факторами, с остаточной (случайной) дисперсией, вызванной неучтенными факторами. Если гипотеза отвергается, то делается вывод о том, что данный фактор или взаимодействие факторов оказывают существенное влияние на изменение изучаемого свойства геологического объекта