- •Тема 2: учет неопределенностей в теории принятия решений
- •2. Основные идеи математической статистики интервальных данных
- •3. Интервальные данные в задачах оценивания характеристик распределения
- •4. Интервальные данные в задачах проверки гипотез
- •5. Асимптотический линейный регрессионный анализ для интервальных данных
- •6. Интервальный дискриминантный анализ
- •8. Интервальный кластер-анализ
- •9. Место статистики интервальных данных (сид) среди методов описания неопределенностей
4. Интервальные данные в задачах проверки гипотез
С позиций статистики интервальных данных целесообразно изучить все практически используемые процедуры прикладной математической статистики, установить соответствующие нотны и рациональные объемы выборок. Это позволит устранить разрыв между математическими схемами прикладной статистики и реальностью влияния погрешностей наблюдений на свойства статистических процедур. Статистика интервальных данных – часть теории устойчивых статистических процедур, развитой в монографии [3]. Часть, более адекватная реальной статистической практике, чем некоторые другие постановки, например, с засорением нормального распределения большими выбросами.
Рассмотрим подходы статистики интервальных данных в задачах проверки статистических гипотез. Пусть принятие решения основано на сравнении рассчитанного по выборке значения статистики критерия с граничным значением С: если f>C, то гипотеза отвергается, если жеf<C, то принимается. С учетом погрешностей измерений выборочное значение статистики критерия может принимать любое значение в интервале Это означает, что «истинное» значение порога, соответствующее реально используемому критерию, находится междуC-Nf(y) и C+Nf(y), а потому уровень значимости описанного правила (критерия) лежит между и , где P(Z)=P(f<Z).
Теоретические результаты в области статистических методов входят в практику через алгоритмы расчетов, воплощенные в программные средства (пакеты программ, диалоговые системы). Ввод данных в современном статистической программной системе должен содержать запросы о погрешностях результатов измерений. На основе ответов на эти запросы вычисляются нотны рассматриваемых статистик, а затем – доверительные интервалы при оценивании, разброс уровней значимости при проверке гипотез, рациональные объемы выборок. Необходимо использовать систему алгоритмов и программ статистики интервальных данных, «параллельную» подобным системам для классической математической статистики.
5. Асимптотический линейный регрессионный анализ для интервальных данных
Статистическое исследование зависимостей - одна из наиболее важных задач, которые возникают в различных областях науки и техники. Под словами "исследование зависимостей" имеется в виду выявление и описание существующей связи между исследуемыми переменными на основании результатов статистических наблюдений. К методам исследования зависимостей относятся регрессионный анализ, многомерное шкалирование, идентификация параметров динамических объектов, факторный анализ, дисперсионный анализ, корреляционный анализ и др. Однако многие реальные ситуации характеризуются наличием данных интервального типа, причем известны допустимые границы погрешностей (например, из технических паспортов средств измерения).
Если какая-либо группа объектов характеризуется переменными Х1, Х2, ,...,Хm и проведен эксперимент, состоящий из n опытов, где в каждом опыте эти переменные измеряются один раз, то экспериментатор получает набор чисел: Х1j, Х2j, ,...,Хmj (j = 1,…, n).
Однако процесс измерения, какой бы физической природы он ни был, обычно не дает однозначный результат. Реально результатом измерения какой-либо величины Х являются два числа: ХH— нижняя граница и ХB — верхняя граница. Причем ХИСТ Î [ХH, ХB], где ХИСТ - истинное значение измеряемой величины. Результат измерения можно записать как X: [ХH, ХB]. Интервальное число X может быть представлено другим способом, а именно, X: [Хm, Δx], где ХH = Хm - Δx , ХH = Хm + Δx . Здесь Хm - центр интервала (как правило, не совпадающий с ХИСТ), а Δx - максимально возможная погрешность измерения.