
- •Билет №1
- •1)Принципы и методы геолого-математического моделирования. Геологические совокупности: изучаемая, опробуемая, выборочная.
- •2)Корреляционные связи между двумя величинами. Линии регрессии. Способы вычисления коэффициентов уравнения регрессии.
- •Распределения и линия регрессии у на х.
- •Билет №2
- •Некоторые теоретические законы распределения: нормальный, логнормальный, биномиальный, Пуассона.
- •Эта функция достигает максимума в точке
- •Билет №3
- •1)Точечные и интервальные оценки параметров распределения по выборочным данным при нормальном и логнормальном законах распределения.
- •2)Понятие о статистических гипотезах. Ошибки 1-го и 2-го рода. Доверительная и критическая области критерия, уровень значимости.
- •Билет №4
- •1)Методы проверки гипотезы о соответствии распределения теоретическому закону.
- •2)Полигармонический анализ.
- •Билет №5
- •1) Коэффициент корреляции, условия и возможности его использования в геологии.
- •2)Непараметрические критерии для проверки гипотезы о равенстве двух неизвестных средних.
- •Билет №6
- •1)Корреляции, условия и возможности его использования в геологии.
- •2)Параметрические критерии для проверки гипотезы о равенстве двух неизвестных средних.
- •Билет №7
- •1) Проверка гипотез о равенстве неизвестных дисперсий.
- •2)Корреляционные связи между двумя величинами. Линии регрессии. Способы вычисления коэффициентов уравнения регрессии.
- •Распределения и линия регрессии у на х.
- •Билет №8
- •1)Факторный анализ.
- •2)Критерий Стьюдента.
- •Билет №9.
- •1)Дискриминантный анализ и его использование в геологии.
- •2)Критерий оценки значимости нелинейной корреляционной связи
- •Билет №10
- •1)Биномиальный закон распределения случайной величины.
- •2)Уравнения регрессии, методы вычисления их коэффициентов.
- •Билет №11
- •1)Дисперсионный анализ.
- •2)Критерий Фишера.
- •Билет №12
- •1)Кластерный анализ.
- •Расчет вариантов группирования
- •2)Ранговый коэффициент корреляции, необходимость и границы его применения.
- •Расчет рангового коэффициента корреляции
- •Билет №13
- •1)Интервальная оценка математического ожидания.
- •2)Случайные функции.
- •Билет №14
- •1)Понятие вероятности случайного события. Случайная величина и ее характеристики.
- •2)Проверка гипотезы о линейном характере корреляционной связи.
- •Билет №15
- •1)Моделирование пространственной изменчивости. Тренд-анализ.
- •Р ис. 28. Разбивка последовательности значений
- •2)Оценка силы корреляционных связей между 2-мя случайными величинами.
2)Оценка силы корреляционных связей между 2-мя случайными величинами.
Ковариация
- это математическое ожидание произведения
отклонений двух случайных величин от
их математического ожидания. Для
выборочных данных формула расчета
ковариации имеет вид:
Ковариация обладает размерностью, поэтому в практике обычно пользуются коэффициентом корреляции, который представляет собой ковариацию, нормированную по стандартам x и y :
Коэффициент корреляции определяет тесноту линейной связи между двумя величинами. Его значения изменяются от -1 до +1. При r = 0 связь между величинами отсутствует. При \r\ = 1 связь функциональная. Знак ± показывает, прямой, или обратной пропорциональной является взаимосвязь.
Коэффициент
корреляция подсчитывается по формуле:
где N - общее количество точек, n1,3 - количество точек в квадрантах 1 и III, n2,4 - то же, в квадрантах II и IV.
Следовательно,
проверка гипотезы о наличии корреляционной
связи заключается в оценке значимости
отличия от нуля вычисленных по выборке
значений r:
Критерий
для оценки значимости отличия r
от
0 предложен Фишером:
Если
вычисленное значение t
больше,
чем
взятое
из таблицы распределения Стьюдента, то
отличие r
от
0 признается значимым. В геологической
практике иногда пользуются упрощенным
критерием:
Во многих руководствах по математической статистике и задачниках по геохимии есть специальные таблицы критических значений коэффициента корреляции в зависимости от числа наблюдений N.
Коэффициент
корреляции очень чувствителен к виду
функции распределения величин, входящих
в двумерную систему. Поэтому, если эти
распределения отличаются от нормальных
и не поддаются нормализации, для проверки
гипотезы о наличии корреляционной связи
следует использовать ранговый
коэффициент корреляции Спирмена.
При этом каждому значению х
и уприсваивается
ранг в порядке возрастания их значений.
Если значения повторяются, им присваивается
средний между повторяющимися значениями
ранг. Выражение для r
имеет вид:
где n - количество пар значений в выборке, d - разность рангов сопряженных значений х и у.
Для
оценки значимости отличия рангового
коэффициента корреляции от 0 существует
специальная таблица критических значений
(1, 16). Можно также воспользоваться
выражением:
где φ(р) - значение обратной функции нормального распределения при доверительной вероятности р(берется из таблицы).
Если вычисленное значение r окажется больше r крит., отличие его от нуля считается значимым. В противном случае считаем, что линейная связь между величинами не установлена.
В случае, если корреляционная связь имеет нелинейный характер, она может существовать и при r=0. В этой ситуации необходимо вычисление корреляционного отношения (η). Корреляционное отношение показывает, какую долю от общей дисперсии составляет дисперсия, учтенная уравнением регрессии (закономерная составляющая дисперсии):
Незакономерная,
случайная составляющая дисперсии
характеризует разброс значений вокруг
линии регрессии. Таким образом:
Отсюда
ясно, что, чем меньше случайная
составляющая, т. е., чем меньше разброс
значений от линии регрессии, тем выше
значение корреляционного отношения.
Закономерная составляющая дисперсии
рассчитывается по формулам:
Выборочные данные при этом разбиваются на группы, для каждой из которых подсчитываются (или ). В формуле N - общее число наблюдений, т - число групп, ni- число наблюдений в i группе. Для расчета Sх и S уследует воспользоваться формулой (23). ixiy
Значения
η
изменяются
от 0 (связь отсутствует) до 1 (связь
функциональная). В случае линейного
характера взаимосвязи:
Таким
образом, коэффициент корреляции можно
рассматривать как частный случай
корреляционного отношения. Закономерная
составляющая дисперсии в этом случае
связана с коэффициентом корреляции
соотношением:
Значимость
отличия η
от
нуля проверяется по критерию:
Условные обозначения те жe, что в формуле. Если η = 0, то Θ у распределена по нормальному закону с параметрами (0,1). Следовательно, если вычисленное значение Θ yпревысит 3 (при доверительной вероятности 0,99) или 2 (при доверительной вероятности 0,95), считаем, что корреляционная связь существует.
Критерий
Фишера он основан на сравнении значений
η и
r ,
которые в случае линейного характера
связи должны быть равны.
Обозначения те же, что в формуле (54). Если вычисленное значение превысит Fq, т-2 , N - т, взятое из таблиц распределения Фишера, то связь признается нелинейной.