Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мгп / Лекция 14, МГП .ppt
Скачиваний:
20
Добавлен:
21.02.2016
Размер:
159.23 Кб
Скачать

Лекция 14

Тема: Определение изменений в рядах гидрологических наблюдений

Курс «Моделирование гидрологических процессов»

Проверки гипотез (1)

Изменения во временных рядах могут происходить:

постепенно (тенденция), внезапно (пошаговое изменение) или в более сложной форме

они могут влиять на среднее значение, медиану, дисперсию, автокорреляцию и т.д.

Для того чтобы выполнить статистическую проверку, необходимо определить нулевую и альтернативную гипотезы

Для сравнения нулевой и альтернативной гипотез выбирается проверочная статистика и оценивается ее значимость

Простым примером тестовой статистики является градиент линейной регрессии, который можно использовать для проверки тренда среднего

Если тренда нет (нулевая гипотеза), градиент регрессии - близок к нулю

Если наблюдается большой тренд среднего (альтернативная гипотеза), то значение градиента регрессии - отличается от нуля

Проверки гипотез (2)

Уровень значимости показывает, отличается ли тестовая

статистика от диапазона значений, которые обычно наблюдаются при нулевой гипотезе:

Ошибка первого типа - проверка ошибочно определяет тренд, когда он отсутствует

Ошибка второго типа - нет тренда, когда на самом деле имеется альтернативная гипотеза (тренд существует)

Стандартные проверки требуют некоторых или всех следующих

предположений:

особая форма распределения

постоянство распределения

независимость распределения (она нарушается, если есть корреляция)

Если предположения, сделанные при статистических проверках,

не выполняются по итогам данных, тогда результаты проверки могут быть бесполезными

Этапы статистической проверки

Решить, какой тип ряда или переменной необходимо проверить в зависимости от интересующих задач, например данные о среднемесячных максимальных годовых значениях или данные без сезонной составляющей

Определить рассматриваемый тип изменений (тренд/пошаговое изменение)

Проверить предположения о данных, например с помощью разведочного анализа данных

Выбрать одну или несколько тестовых статистик, которые подходят каждому типу изменений; предпочтителен выбор нескольких статистик

Выбрать подходящий уровень значимости

Проанализировать результаты

Непараметрическое тестирование (1)

При использовании непараметрических методов нет необходимости в предположениях о форме распределения

Непараметрические методы:

Ранговые тесты: эти тесты используют разряды значений данных, но не сами действительные значения

Тесты, использующие многократные нормирующие преобразования:

многие тесты опираются на предположение о нормальности распределения

Метод повторной выборки

Метод повторной выборки

Рассмотрим проверку ряда на наличие тренда: возможный тест - градиент регрессии

Если в данных тренда нет (нулевая гипотеза), тогда порядок величин значений ряда не должен значительно влиять на тест

Следовательно, переупорядочивание или перестановка элементов ряда данных не должна сильно изменить градиент

При методе повторной выборки данные перетасовываются многократно

Тестовая статистика пересчитывается после каждой перестановки

После многочисленных перестановок начальная тестовая статистика сравнивается с полученными значениями статистики:

Если начальная тестовая статистика существенно отличается от большинства полученных значений, то тренд есть

Если начальная тестовая статистика находится где-то посередине полученных значений, то разумно предположить, что нулевая гипотеза верна и нет доказательств тренда

Достоинства метода повторной выборки и т.д.

Методы повторной выборки, проверка перемещений и метод «бутстрапа» представляют собой надежный набор методов оценки уровня значимости тестируемой статистики:

Они являются:

весьма гибкими

их можно применять к широкому спектру типов данных, включая автокоррелированные или сезонные данные

эти методы относительно эффективны

Методы повторной выборки очень полезны при проверке гидрологических данных, поскольку они требуют относительно немного предположений о данных; тем не менее они достаточно действенны

Они обеспечивают гибкую методологию, которая позволяет оценивать уровни значимости для любой выбранной тестовой статистики

Они дают возможность применять традиционные статистические тесты для обработки временных рядов с помощью надежного метода определения значимости

Спасибо за внимание!

Соседние файлы в папке мгп