
- •Оглавление
- •Глава 1. Структура современной эконометрики 6
- •Глава 2. Выборочные исследования 20
- •Глава 3. Основы теории измерений 33
- •Глава 4. Статистический анализ числовых величин (непараметрическая статистика) 40
- •Глава 14. Эконометрика прогнозирования и риска 256
- •Глава 15. Современные эконометрические методы 270
- •Предисловие
- •Глава 1. Структура современной эконометрики
- •1.1.Эконометрика сегодня
- •1.3. Структура эконометрики
- •1.4.Специфика экономических данных
- •1.5. Нечисловые экономические величины
- •1.6.Статистика интервальных данных - научное направление на стыке метрологии и математической статистики
- •1.7. Эконометрические модели
- •1.8.Применения эконометрических методов
- •1.9. Эконометрика как область научно-практической деятельности
- •1.10. Эконометрические методы в практической и учебной деятельности
- •Цитированная литература
- •Глава 2. Выборочные исследования
- •2.1. Построение выборочной функции спроса
- •2.2. Маркетинговые опросы потребителей
- •Г. О курсе "Основы экономики"
- •Д. Дополнительная информация
- •2.3. Проверка однородности двух биномиальных выборок
- •Цитированная литература
- •Глава 3. Основы теории измерений
- •3.1. Основные шкалы измерения
- •3.2. Инвариантные алгоритмы и средние величины
- •3.3. Средние величины в порядковой шкале
- •3.4. Средние по Колмогорову
- •Цитированная литература
- •Глава 4. Статистический анализ числовых величин (непараметрическая статистика)
- •4.1. Часто ли распределение результатов наблюдений является нормальным?
- •4.2. Неустойчивость параметрических методов отбраковки резко выделяющихся результатов наблюдений
- •4.3. Непараметрическое доверительное оценивание характеристик распределения
- •4.4. О проверке однородности двух независимых выборок
- •Критерий Крамера-Уэлча равенства математических ожиданий
- •4.5. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?
- •4.6. Состоятельные критерии проверки однородности для независимых выборок
- •4.7. Методы проверки однородности для связанных выборок
- •Цитированная литература
- •Глава 5. Многомерный статистический анализ
- •5.1. Оценивание линейной прогностической функции
- •5.2. Основы линейного регрессионного анализа
- •5.3. Основные понятия теории классификации
- •5.4. Эконометрика классификации
- •Цитированная литература
- •Глава 6. Эконометрика временных рядов
- •6.1. Модели стационарных и нестационарных временных рядов, их идентификация
- •6.2. Системы эконометрических уравнений
- •6.3. Оценивание длины периоды и периодической составляющей
- •6.4. Метод жок оценки результатов взаимовлияний факторов
- •Цитированная литература
- •Глава 7. Эконометрический анализ инфляции
- •7. 1. Определение индекса инфляции
- •7.2. Практически используемые потребительские корзины и соответствующие индексы инфляции
- •7.3. Свойства индексов инфляции
- •7.4. Возможности использования индекса инфляции в экономических расчетах
- •7.5. Динамика цен на продовольственные товары с Москве и Московской области
- •Цитированная литература
- •Глава 8. Статистика нечисловых данных
- •8.1. Объекты нечисловой природы
- •8.2. Вероятностные модели конкретных видов объектов нечисловой природы
- •8.3. Структура статистики объектов нечисловой природы
- •8.4. Законы больших чисел и состоятельность статистических оценок в пространствах произвольной природы
- •8.5. Непараметрические оценки плотности в пространствах произвольной природы
- •Цитированная литература
- •Глава 9. Статистика интервальных данных
- •9.1. Основные идеи статистики интервальных данных
- •9.2. Примеры статистического анализа интервальных данных
- •9.3. Статистика интервальных данных и оценки погрешностей характеристик финансовых потоков инвестиционных проектов
- •Цитированная литература
- •Глава 10. Проблемы устойчивости эконометрических процедур
- •10.1. Общая схема устойчивости
- •10.2. Робастность статистических процедур
- •10.3. Устойчивость по отношению к объему выборки
- •10.4. Устойчивость по отношению к горизонту планирования
- •Цитированная литература
- •Глава 11. Эконометрические информационные технологии
- •11.1. Проблема множественных проверок статистических гипотез
- •11.2. Проблемы разработки и обоснования статистических технологий
- •11.3. Методы статистических испытаний (Монте-Карло) и датчики псевдослучайных чисел
- •11.4. Методы размножения выборок (бутстреп-методы)
- •11.5. Эконометрика в контроллинге
- •Цитированная литература
- •Глава 12. Эконометрические методы проведения экспертных исследований и анализа оценок экспертов
- •12.1. Примеры процедур экспертных оценок
- •12.2. Основные стадии экспертного опроса
- •12.3. Подбор экспертов
- •12.4. О разработке регламента проведения сбора и анализа экспертных мнений
- •12.5. Методы средних баллов
- •12.6. Метод согласования кластеризованных ранжировок
- •12.7. Математические методы анализа экспертных оценок
- •Цитированная литература
- •Глава 13. Эконометрические методы управления качеством и сертификации продукции
- •13.1. Основы статистического контроля качества продукции
- •13.2. Асимптотическая теория одноступенчатых планов статистического контроля
- •13.3. Некоторые практические вопросы статистического контроля качества продукции и услуг
- •13.4. Всегда ли нужен контроль качества продукции?
- •13.5. Статистический контроль по двум альтернативным признакам и метод проверки их независимости по совокупности малых выборок
- •13.6. Эконометрика качества и сертификация
- •Цитированная литература
- •Глава 14. Эконометрика прогнозирования и риска
- •14.1. Методы социально-экономического прогнозирования
- •14.2. Основные идеи технологии сценарных экспертных прогнозов
- •14.3. Различные виды рисков
- •14.4. Подходы к управлению рисками
- •Цитированная литература
- •Глава 15. Современные эконометрические методы
- •15.1. О развитии эконометрических методов
- •15.2. Точки роста
- •15.3. О некоторых нерешенных вопросах эконометрики и прикладной статистики
- •15.4. Высокие статистические технологии и эконометрика
- •Цитированная литература
- •Приложение 1 Вероятностно-статистические основы эконометрики
- •Цитированная литература
- •Приложение 2 Нечеткие и случайные множества
- •К последовательности операций над случайными множествами
- •Цитированная литература
- •Приложение 3 Методика сравнительного анализа родственных эконометрических моделей
- •П3 4. Эмпирические единичные показатели качества
- •Кластеризации и усреднения ранжировок
- •Цитированная литература
- •Приложение 4 Примеры задач по эконометрике
- •Проверка однородности двух независимых выборок
- •Проверка однородности связанных выборках
- •Исходные данные для задачи 4.
- •Индекс инфляции
- •Упорядочения по средним рангам и по медианам
- •Медиана Кемени
10.2. Робастность статистических процедур
Термин "робастность" (robustness - англ.) образован от robust - крепкий, грубый (англ.). Сравните с названием одного из сортов кофе - robusta. Имеется в виду, что робастные статистические процедуры должны "выдерживать" ошибки, которые теми или иными способами могут попадать в исходные данные или искажать предпосылки используемых вероятностно-статистических моделей.
Термин "робастный" стал популярным в нашей стране в 1970-е годы. Сначала он использовался фактически как сужение термина "устойчивый" на алгоритмы статистического анализа данных классического типа (не включая теорию измерений, статистику нечисловых и интервальных данных). Затем реальная сфера его применения сузилась.
Пусть исходные данные - это выборка, т.е. совокупность независимых одинаково распределенных случайных величин с одной и той же функцией распределения F(x). Наиболее простая модель изучения устойчивости - это модель засорения
(1)
Эта
модель имеются также моделью Тьюки-Хубера.
(Джон Тьюки - американский исследователь,
П.Хубер, или Хьюбер - швейцарский ученый)
Модель (1) показывает, что с близкой к 1
вероятностью, а именно, с вероятностью
наблюдения
берутся из совокупности с функцией
распределения
которая
предполагается обладающей "хорошими"
свойствами. Например, она имеет известный
эконометрику вид (хотя бы с точностью
до параметров), у нее существуют все
моменты, и т.д. Но с малой вероятностью
появляются
наблюдения из совокупности с "плохим"
распределением, например, взятые из
распределения Коши, не имеющего
математического ожидания, резко
выделяющиеся аномальные наблюдения,
выбросы.
Актуальность модели (1) не вызывает сомнений. Наличие засорений (выбросов) может сильно исказить результаты эконометрического анализа данных. Ясно, что если функция распределения элементов выборки имеет вид (1), где первое слагаемое соответствует случайной величине с конечным математическим ожиданием, а второе - такой, для которого математического ожидания не существует (например, если H(x) - функция распределения Коши), то для итоговой функций распределения (1) также не существует математического ожидания. Исследователя обычно интересуют характеристики первого слагаемого, но найти их, т.е. освободиться от влияния засорения, не так-то просто. Например, среднее арифметическое результатов наблюдений не будет иметь никакого предела (это - строгое математическое утверждение, вытекающее из того, что математическое ожидание не существует [3]).
Существуют различные способы борьбы с засорением. Эмпирическое правило "борьбы с засорениями" при подведении итогов работы команды судей найдено в фигурном катании: наибольшая и наименьшая оценки отбрасываются, а по остальным рассчитывается средняя арифметическая (см. главу 12). Ясно, что "засорение" окажется среди отброшенных оценок.
Оценивать характеристики и параметры, проверять статистические гипотезы, вообще осуществлять эконометрический анализ данных все чаще рекомендуют на основе эмпирических квантилей (другими словами, порядковых статистик, членов вариационного ряда), отделенных от концов вариационного ряда. Речь идет об использовании статистик типа
Ценой небольшой потери в эффективности избавляемся от засоренности типа описанной в модели (1).
Вариантом этого подхода является переход к сгруппированным данным. Прямая разбивается на интервалы, и вместо количественных значений эконометрик подсчитывает лишь, сколько наблюдений попало в те или иные интервалы. Особое значение приобретают крайние интервалы - к ним относят все наблюдения, которые больше некоторого верхнего порога и меньше некоторого нижнего порога. Любым методам анализа сгруппированных данных резко выделяющиеся наблюдения не страшны.
Можно поставить под сомнение и саму опасность засорения. Дело в том, что практически все реальные величины ограничены. Все лежат на каком-то интервале - от и до. Это совершенно ясно, если речь идет о физическом измерении - все укладывается в шкалу прибора. По-видимому, и для эконометрических измерений наибольшие сложности создают не сверхбольшие помехи, а не засорения, что находятся "на грани" между "интуитивно возможным" и "интуитивно невозможным".
Что
же это означает? Если элементы выборки
по абсолютной величине не превосходят
числа А,
то все засорение может сдвинуть среднее
арифметическое на величину
Если
засорение невелико, то и сдвиг мал.
Построена достаточно обширная и развитая теория, посвященная разработке и изучению методов анализа данных в модели (1). С ней можно познакомиться по монографиям [4-6]. К сожалению, в теории обычно предполагается известной степень засорения , а на практике эта величина неизвестна. Кроме того, теория обычно направлена на защиту от воздействий, якобы угрожающих из бесконечности, а на самом деле реальные данные финитны (сосредоточены на конечных отрезках). Все это объясняет, почему теория робастности, исходящая из модели (1), популярна среди теоретиков, но мало интересна тем, кто анализирует реальные экономические данные.
Рассмотрим
несколько более сложную модель. Пусть
наблюдаются реализации независимых
случайных величин
с
функциями распределения
соответственно.
Эта модель соответствует гипотезе о
том, что в процессе наблюдения (измерения)
условия несколько менялись. Естественной
представляется модель малых отклонений
функций распределений наблюдаемых
случайных величин от некоторой "базовой"
функции распределения
.
Множество возможных значений функций
распределений наблюдаемых случайных
величин описывается следующим образом:
Следующий
тип моделей - это введение малой (т.е.
слабой) зависимости между рассматриваемыми
случайными величинами (см., например,
монографию [7]). Ограничения на взаимную
зависимость можно задать разными
способами. Пусть
-
совместная функция распределения,
коэффициент
корреляции между i-ой
и j-ой
случайными величинами. Множество
возможных совместных функций распределения
описывается следующим образом:
Есть еще целый ряд постановок задач робастности. Если накладывать погрешности непосредственно на результаты наблюдений (измерений), то получаем постановки задач статистики интервальных данных (см. главу 11), поскольку каждый результат наблюдения превращается в интервал - исходное значение плюс-минус погрешность.
Разработано много вариантов робастных методов анализа статистических данных (см. монографии [1,4-6]). Иногда говорят, что робастные методы позволяют использовать информацию о том, что реальные наблюдения лежат "около" тех или иных параметрических семейств, например, нормальных. В этом, дескать, их преимущество по сравнению с непараметрическими методами, которые предназначены для анализа данных из всех возможных распределений. Однако количественных подтверждений этих уверений любителей робастных методов обычно не удается найти.