
- •Билет №1
- •1)Принципы и методы геолого-математического моделирования. Геологические совокупности: изучаемая, опробуемая, выборочная.
- •2)Корреляционные связи между двумя величинами. Линии регрессии. Способы вычисления коэффициентов уравнения регрессии.
- •Распределения и линия регрессии у на х.
- •Билет №2
- •Некоторые теоретические законы распределения: нормальный, логнормальный, биномиальный, Пуассона.
- •Эта функция достигает максимума в точке
- •Билет №3
- •1)Точечные и интервальные оценки параметров распределения по выборочным данным при нормальном и логнормальном законах распределения.
- •2)Понятие о статистических гипотезах. Ошибки 1-го и 2-го рода. Доверительная и критическая области критерия, уровень значимости.
- •Билет №4
- •1)Методы проверки гипотезы о соответствии распределения теоретическому закону.
- •2)Полигармонический анализ.
- •Билет №5
- •1) Коэффициент корреляции, условия и возможности его использования в геологии.
- •2)Непараметрические критерии для проверки гипотезы о равенстве двух неизвестных средних.
- •Билет №6
- •1)Корреляции, условия и возможности его использования в геологии.
- •2)Параметрические критерии для проверки гипотезы о равенстве двух неизвестных средних.
- •Билет №7
- •1) Проверка гипотез о равенстве неизвестных дисперсий.
- •2)Корреляционные связи между двумя величинами. Линии регрессии. Способы вычисления коэффициентов уравнения регрессии.
- •Распределения и линия регрессии у на х.
- •Билет №8
- •1)Факторный анализ.
- •2)Критерий Стьюдента.
- •Билет №9.
- •1)Дискриминантный анализ и его использование в геологии.
- •2)Критерий оценки значимости нелинейной корреляционной связи
- •Билет №10
- •1)Биномиальный закон распределения случайной величины.
- •2)Уравнения регрессии, методы вычисления их коэффициентов.
- •Билет №11
- •1)Дисперсионный анализ.
- •2)Критерий Фишера.
- •Билет №12
- •1)Кластерный анализ.
- •Расчет вариантов группирования
- •2)Ранговый коэффициент корреляции, необходимость и границы его применения.
- •Расчет рангового коэффициента корреляции
- •Билет №13
- •1)Интервальная оценка математического ожидания.
- •2)Случайные функции.
- •Билет №14
- •1)Понятие вероятности случайного события. Случайная величина и ее характеристики.
- •2)Проверка гипотезы о линейном характере корреляционной связи.
- •Билет №15
- •1)Моделирование пространственной изменчивости. Тренд-анализ.
- •Р ис. 28. Разбивка последовательности значений
- •2)Оценка силы корреляционных связей между 2-мя случайными величинами.
2)Понятие о статистических гипотезах. Ошибки 1-го и 2-го рода. Доверительная и критическая области критерия, уровень значимости.
Под статистическимипонимаются такие гипотезы, которые относятся либо к виду, либо к отдельным параметрам распределения случайной величины. Например, статистической является гипотеза о том, что веса проб, отобранные одним человеком по одной методике распределены по нормальному закону.
Поскольку выборочные данные ограничены по объему и носят случайный характер, при обосновании выводов по статистическим данным вполне возможны ошибочные заключения. При этом ошибки могут быть двух видов:
1) если гипотеза, являющаяся правильной, не принята - это ошибка 1-го рода,
2) если принята ложная гипотеза - ошибка 2-го рода.
Проверяемая гипотеза обычно обозначается Н0 и называется нулевой, конкурирующая или альтернативная гипотеза обозначаетсяН1. Например:Н0:μ1= μ2;Н1: μ1 μ2.
Уровень значимости q определяет вероятность ошибки 1-го рода, и, казалось бы, надо брать q, как можно меньше. Но, к сожалению, это далеко не всегда оправдано.
Рассмотрит альтернативу Н1:μ1 μ2 . Очевидно, что событие t Т0 при условии, что верна Н1, будет способствовать ошибочному решению, т.е. принятию гипотезы Н0, хотя она не верна. Эта ошибка 2-го рода, и она тем больше, чем меньше q.
Ее вероятность обозначена β, вероятность ошибки 1-го рода обозначена α.
Очевидно, надо стремиться, чтобы α и β примерно уравновешивались. В геологии обычно очень трудно оценить вероятность ошибки 2-го рода, поэтому во всех случаях формального выбора доверительная область ограничивается уровнем значимости 5% (то есть доверительной вероятностью 95%).
Билет №4
1)Методы проверки гипотезы о соответствии распределения теоретическому закону.
I. О соответствии эмпирического распределения теоретическому закону
II. О равенстве неизвестных средних
III. О равенстве неизвестных дисперсий
О соответствии эмпирического распределения теоретическому закону
Критерий Пирсона:
Для проверки гипотезы разбиваем область выборочных значений х1,х2, х3, .. хn на k интервалов, необязательно равных, и подсчитываем частоты попадания значений выборки в эти интервалы ni
Затем подсчитываем теоретические частоты попадания значений в эти интервалы: Ni= N·Pi, здесь
N – общее число значений в выборке;
Pi=F0(аi+1) -F0(аi); (F0(t)– табличное значение проверяемой функции распределения в точке t .
ai,аi+1 - границы интервалов.
Затем вычисляем значение критерия:
χ2
=
Если вычисленное значение χ2больше, чем χ2q,k -3, взятое из таблицы χ2-распределения, то гипотезаНо отклоняется, т.е. считаем, что распределение не соответствует проверяемому закону (при заданном уровне значимости q).
Упрощенный критерий соответствия распределения нормальному закону:
При нормальном распределенииА=0и Е=0. Следовательно, отклонение от нуля выборочных значений А и Е не должно превышать t*SAи t*SE. Здесьt – табличное значение функции нормального распределения при заданной доверительной вероятности.
Обычно принимают t=3, что соответствует 99% доверительной вероятности.
Критерий соответствия распределения нормальному закону:
О равенстве неизвестных средних
а) Проверка гипотезы о равенстве двух неизвестных средних
При нормальном законе распределения и соблюдении неравенства δ21 δ22применяют параметрический критерий Стъюдента:
t
=
Если вычисленное t>tq,(n1+n2-2), взятого из таблицы распределения Стъюдента, то гипотеза о равенстве неизвестных средних отвергается.
В противном случае расхождение считается незначимым и принимается гипотеза о равенстве неизвестных средних.
Если выяснится, что δ21=δ22, то критерий Стьюдента следует применять в следующем виде:
t=
где
S
=
.
Критическое значение tq,n1 +n2 -2 при этом также берется из таблицы распределения Стьюдента.
Если распределение случайной величины логнормальное, то следует использовать критерий Д. А. Родионова (при δ21 δ22)
t
=
где S21 и S22 -дисперсии распределения логарифмов значений, полученные по выборкам. Критическое значение tqнаходится по таблице функции нормального распределения F(t).
Если
выяснится, что δ21
= δ22,
то можно использовать критерий
Стьюдента,заменив
и
, на ln
,
и ln
.
Если закон распределения случайных величин неизвестен, следует воспользоваться непараметрическими критериями (Ван-дер-Вардена, Вилкоксона, Манна-Уитни и т.д.).
Рассмотрим пример применения критерия Манна-Уитни. Как и во всех критериях подобного типа, вычислительные операции проводится не с самими числами, а с их рангами (порядковыми номерами).
Допустим, мы имеем две выборки Х и Y объема nи m и хотим проверить гипотезу о том, что они принадлежат к одной и той же совокупности. Объединим две выборки и расположим все значения в порядке возрастания – от меньшего к большему. Наименьшее значение при этом получит ранг 1, наибольшее – ранг (n+m). Если выборки принадлежат одной совокупности, то естественно ожидать, что ранги одной из выборок будут достаточно равномерно рассеяны в общей последовательности рангов.
Ранговый
(непараметрический) критерий Манна-Уитни
имеет вид:
Проверка гипотезы о равенстве k неизвестных средних
при нормальном законе распределения:
1) если дисперсии равны:
2) если дисперсии не равны:
Если вычисленное значение νпревысит табличное значение χ2q,k-1 взятое из таблиц χ2-распределения, то гипотеза о равенстве k средних отвергается.
О равенстве неизвестных дисперсий
а) проверка гипотезы о равенстве двух дисперсий при нормальном распределении (критерий Фишера):
б
)
проверка гипотезы о равенстве k
дисперсий при нормальном распределении
(критерий Бартлета):