Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
33
Добавлен:
25.04.2015
Размер:
166.82 Кб
Скачать

МАТЕМАТИЧЕСКИЕ МОДЕЛИ В ПРИКЛАДНОЙ СТАТИСТИКЕ

Лекция № 5. Для чего нужны математические модели

Содержание.

1. О двух подходах к статистическому моделированию.

2.Понятие математической модели.

3.Общая логическая схема и основные этапы содержательного математического моделирования.

а) Основные этапы моделирования.

б) Моделирование механизма явления вместо формальной статистической фотографии.

1. О двух подходах к статистическому моделированию.

Оценивая взаимоотношения теории вероятностей и прикладной статистики, можно прийти к выводу, что:

если теория вероятностей предоставляет исследователю набор математических моделей, имитирующих механизмы функционирования гипотетических реальных явлений или систем стохастической природы,

то одним из главных назначений прикладной статистики является обоснованный выбор среди множества возможных (как бы заранее

заготовленных) моделей той, которая наилучшим (в определенном смысле) образом соответствует имеющимся в распоряжении исследователя статистическим данным, характеризующим реальное поведение конкретно исследуемой системы.

Таким образом, успешное решение проблемы наилучшей статистической обработки исходных данных зависит в первую очередь от знания подходящих моделей и от умения «прилаживать» эти модели к исследуемой реальной действительности и, если это необходимо, сконструировать новую, не содержащуюся в наборе имеющихся «заготовок» модель, отражающую специфику анализируемой конкретной задачи.

Построение и экспериментальная проверка модели, т. е. математическое описание интересующих исследователя связей и отношений между реальными элементами анализируемой системы, обычно основаны на одновременном использовании информации двух типов:

а) априорной информации о природе и характере исследуемых соотношений;

б) исходных статистических данных, характеризующих процесс и результат функционирования анализируемой системы.

При этом используется один из двух подходов (а точнее, либо только первый, либо их комбинация).

Если исследователь располагает информацией обоих типов, то, как правило, используется прием содержательного (реалистического) математического моделирования, при котором из априорной информации

о природе искомых соотношений (математически формализованной в виде некоторых исходных предпосылок или исходных допущений)

удается вывести общий вид аналитических уравнений, описывающих эти соотношения, после чего с помощью статистического «переваривания» информации б) оцениваются численные значения параметров, входящих в упомянутые аналитические уравнения (этап подгонки или приладки модели).

Если же исследователь располагает только априорной информацией типа а) или, при наличии информации обоих типов, желает «проиграть» (сымитировать) поведение анализируемой реальной системы при варьировании численных значений параметров, входящих в аналитическую запись модели, или искусственно (опираясь на модельные соотношения)

сгенерировать статистические данные типа б) с целью их пополнения, то наряду с элементами описанного выше математического моделирования (реализованными в первую очередь) исследователь должен обратиться к помощи ЭВМ.

Этот тип моделирования принято называть статистическим или

моделированием типа «Монте-Карло».

2. Понятие математической модели.

Математическая модель – это абстракция реального мира, в которой интересующие исследователя отношения между реальными элементами заменены подходящими отношениями между математическими объектами.

Математические модели, в описании которых используются случайные величины, называют вероятностными или стохастическими.

Всякая модель является упрощенным представлением действитель-

ности, и искусство моделирования состоит в знании того, что, где, когда и как можно и нужно упростить. Это знание естественно приходит с опытом.

Следующий пример помогает «прочувствовать» ряд узловых моментов и некоторые общие «тонкие места», с которыми приходится сталкиваться исследователю в процессе реалистического моделирования.

Рассмотрим эксперимент, в котором каждый из п испытуемых прочитывает текст, набранный шрифтом А, и эквивалентный ему по трудности текст, набранный шрифтом Б. В обоих случаях фиксируется время t, затрачиваемое испытуемым на чтение. Пусть t(i, А) и t(i, Б) – время, потребовавшееся i-му испытуемому на чтение контрольных текстов, набранных соответственно шрифтами А и Б. Один из возможных простых вариантов математической модели данной ситуации может быть описан следующим образом:

t (i , А) = m (i) + TA + Xi ,

 

i = 1, 2,..., n.

(1)

t (i , Б) = т(i) + TБ + Hi ,

 

где т(i) – случайная величина, отражающая

скорость чтения i-го

испытуемого и не зависящая от шрифта, TA и TБ

постоянные, зависящие

только от шрифта, a Xi и Hi – взаимно независимые случайные ошибки со средними значениями, равными нулю, и с одинаковыми дисперсиями S2. В правую часть уравнений (1) входит больше величин, чем в левую. Это означает, что оценить основные числовые характеристики величин т(i), TA , TБ, Xi и Hi по наблюдениям {t(i, A), t(i, Б)}i=1,n – нельзя. Более того, даже при отсутствии в модели ошибок Xi и Hi , т. е. в ситуации, когда в левой части 2п величин, а в правой – только п+2, найти без дополнительных соглашений величины TA , TБ и основные числовые характеристики случайных величин mi (i =1, 2, ..., п) также нельзя. (В подобных случаях иногда принято говорить, что модель неизмерима относительно имеющихся опытных данных.) Однако, если в задачу исследования входит только сравнение средней скорости чтения двух анализируемых шрифтов, то неизмеримость модели нам не мешает. В самом деле, случайная величина

t (i) = t (i , А) t (i , Б) = TA TБ + Xi Hi

(2)

имеет положительное среднее значение, если шрифт Б более удобен для чтения, чем шрифт A, и отрицательное среднее значение – в противном случае. Оценка же раз разности TA TБ по значениям t(i) уже не представляет труда. Аналогично, если бы требовалось охарактеризовать меру случайного разброса в скорости чтения каждого из испытуемых (т. е.

оценить дисперсию (i), мы могли бы найти дисперсию случайных величин

1

(t(i, А) + t(i, Б)) = т(i) + (TA + TБ)/2 + (Xi + Hi )/2.

(3)

2

 

 

и вычесть из нее величину S2/2, определяющую вклад случайных ошибок в модели (3). В данном случае дисперсию т(i) мы оцениваем, не определяя т(i) для каждого испытуемого, а воспользовавшись тем, что TA и TБ – постоянные.

Таким образом, с помощью различных вариантов моде» ли (1) можно учесть: различие между испытуемыми, в скорости чтения; различие между средней скоростью чтения шрифтов A и Б; случайный характер времени, затрачиваемого испытуемым на чтение текста. Вместе с тем в ней пренебрегается возможной зависимостью разности TA TБ от скорости чтения индивидуума (т( i ) ) и от того, в какой последовательности прочитываются тексты: сначала A, а затем Б или наоборот. Кроме того, упрощением является и предположение о постоянстве дисперсий S2 случайных погрешностей. Безусловно, для более тщательного изучения длительности чтения потребовалась бы более сложная модель, в которой должны были бы найти отражение указанные выше зависимости. Однако, если речь идет только о сравнении средних скоростей чтения шрифтов, то достаточно рассмотреть модель (2) – она свою роль выполняет: подсказывает достаточно эффективный способ анализа данных, отвергая при этом другой возможный (и слишком наивный) подход, при котором сначала усредняются в отдельности данные по каждому шрифту:

t ( • , A) = t(i, A) / n ; t ( • , Б) =

t(i, Б) / n ,

( 4)

i

i

 

а затем производится сравнение средних t ( • , A) и t ( • , Б),

полученных

якобы по двум независимым сериям наблюдений (это сравнение может быть осуществлено, например, с помощью критерия Стьюдента).

Последний метод на практике может привести к резкой потере эффективности выявления существующего различия между шрифтами, так как наблюдения t(i, А) и t(i, Б) оказываются на самом деле существенно зависимыми из-за общего значения m(i).

В некотором смысле математическая модель является для исследователя тем же, чем для физика физическая лаборатория. Можно ставить эксперименты в «мире», порожденном моделью, и, если математическая модель является правдивым отражением действительности, результаты этих экспериментов применимы к реальному миру.

Говоря о применимости моделей к описанию реальной

действительности, подразумевается возможность их практического использования в качестве базы, отправной точки при выборе наилучшего способа статистической обработки исходных данных, а

также при решении таких задач, как планирование, прогнозирование,

оптимальное управление системами и процессами, оценка

эффективности функционирования (или комплексной характеристики качества) сложной системы, диагностика (медицинская и техническая), нормирование.

3. Общая логическая схема и основные этапы содержательного математического моделирования

а) Основные этапы моделирования.

На первом (исходном) этапе должны быть определены:

конечные цели моделирования;

набор факторов и показателей, взаимосвязи между которыми нас интересуют;

роли этих факторов и показателей – какие из них, в рамках поставленной конкретной задачи, можно считать входными (т. е. пол-

ностью или частично регулируемыми или хотя бы легко поддающимися регистрации и прогнозу; подобные факторы несут смысловую нагрузку объясняющих), а какие – выходными (главный

объект исследования; эти факторы обычно трудно поддаются непосредственной регистрации или прогнозу и несут смысловую нагрузку объясняемых).

Если исходная статистическая информация еще не собрана, то задача сбора статистических данных тоже включается в содержание первого этапа.

Так, в примере со шрифтами различные варианты конечных целей исследования по-разному очерчивали набор анализируемых факторов

(тип шрифтов, индивидуализация испытуемых) и показателей (от

избыточного набора в 3п+2 показателей, участвующих в модели (1), до двух усредненных показателей (4)), одновременно по-разному распределяя роли между ними.

На втором этапе приступают к постулированию, математической формализации, и, если возможно, к экспериментальной проверке ряда естественных исходных допущений, относящихся к природе и качественному

характеру «физики» исследуемого явления (этап формирования априорной информации).

Если принимаемые допущения по чему-либо не могут подвергнуться экспериментальной проверке, то их следует подкрепить теоретическими рассуждениями о механизме изучаемого явления (например, они могут

признаваться специалистами данной прикладной области – экономики, социологии, техники, медицины и т. п. – в качестве отдельных частных объективных закономерностей). Так, при построении моделей (1) – (4) мы пользовались следующими на первый взгляд естественными, но, тем не менее, не бесспорными исходными допущениями:

остаточные случайные компоненты ошибки регистрации») Xi и Hi взаимно независимы;

характеристики скорости чтения m(i) испытуемых не зависят от шрифта; разность TA TБ не зависит от того, в какой последовательности предлагалось прочитывать тексты, и т. д.

Третий этап может быть назван собственно моделирующим, так как он включает в себя непосредственный вывод (опирающийся на принятые и частично экспериментально подтвержденные исходные допущения)

общего вида модельных соотношений, связывающих между собой интересующие нас входные и выходные показатели.

Говоря об общем виде модельных соотношений, имеется в виду то обстоятельство, что на данном этапе будет определена лишь структура модели, ее символическая аналитическая запись, в которой наряду с известными числовыми значениями (представленными исходными статистическими данными) будут присутствовать величины, физический смысл которых определен, а числовые значения – нет (неизвестные параметры модели,

подлежащие статистическому оцениванию).

Впримере со шрифтами вывод модельных соотношений (1) – (3) тривиален: он непосредственно следует из принятых допущений и обозначений.

Влевых частях этих соотношений стоят известные числа (исходные данные), а в правых – неизвестные параметры модели, подлежащие статистическому оцениванию.

Четвертый этап моделирования (статистический анализ модели)

посвящен решению задачи наилучшего подбора, т. е. статистического оценивания неизвестных параметров, входящих в аналитическую запись модели, и исследованию свойств полученных оценок, их точности. Решение этой задачи полностью обслуживается методами статистической обработки данных.

На пятом этапе (этапе верификации модели) используются различные

процедуры сопоставления модельных заключений, оценок, следствий и выводов с реально наблюдаемой действительностью.

Этот этап называют также этапом статистического анализа адекватности модели.

Присутствие шестого этапа зависит от результатов предыдущего этапа.

Он заключается в планировании и проведении исследований, направленных на уточнение модели и, в частности, на дальнейшее развитие и углубление второго этапа, который в определенной мере является ключевым.

б) Моделирование механизма явления вместо формальной

статистической фотографии.

Рассмотрим подробнее тезис о ключевом характере второго этапа.

Утверждается, что адекватность и соответственно эффективность модели будут решающим образом зависеть от того, насколько глубоко и профессионально был проведен анализ реальной сущности изучаемого явления при формировании априорной информации (т. е. в рамках

второго этапа).

Другими словами, при вероятностно-статистическом моделировании и, в частности, на этапе формирования априорной информации о физической природе реального механизма преобразования входных показателей в выходные (результирующие) какая-то часть этого механизма остается скрытой от исследователя (именно об этой части

принято в соответствии с обиходной кибернетической терминологией говорить как о чёрном ящике»).

Чем большее профессиональное знание механизма исследуемого явления продемонстрирует исследователь, тем меньше будет доля «черного ящика» в общей логической схеме моделирования и тем работоспособнее и точнее будет построенная модель.

Вероятностно-статистическое моделирование, полностью основанное на логике «черного ящика», позволяет получить исследователю лишь как бы мгновенную статистическую, фотографию анализируемого явления, в общем случае непригодную, например, для целей прогнозирования.

Напротив, моделирование, опирающееся на глубокий профессиональный анализ природы изучаемого явления, позволяет в

значительной мере теоретически обосновать общий вид конструируемой модели, что дает основание к ее широкому и правомерному использованию в прогнозных расчетах.

Поясним это на примере.

Пусть целью нашего исследования является лаконичное

(параметризованное с помощью модели) описание функции плотности анализируемой случайной величины (заработной платы наугад выбранного из общей генеральной совокупности работника) по исходным данным, представленным случайной выборкой работников х1,

х2,…, х750 объема п = 750.

Игнорируя экономические закономерности формирования искомого закона распределения, т. е. руководствуясь формальным подходом наилучшей мгновенной статистической фотографии, мы должны были бы

запастись достаточно богатым классом модельных плотностей (например, классом кривых Пирсона, и, перебирая эти модели (с одновременной

статистической оценкой участвующих в их записи параметров), найти такую функцию плотности, которая наилучшим в определенном смысле

образом (например, в смысле критерия «хи-квадрат» Пирсона)

аппроксимирует поведение имеющейся у нас эмпирической плотности.

На этом пути в результате расширения запаса гипотетичных модельных плотностей можно добиться очень высокой точности аппроксимации.

Однако, поступая таким образом, мы добиваемся лишь кажущегося хорошего результата, в чем легко можно убедиться, попробовав применить выявленный модельный закон к описанию эмпирической плотности, построенной по другой выборке, извлеченной из той же самой совокупности.

В подавляющем большинстве случаев выявленная ранее модельная плотность оказывается непригодной для описания распределительных закономерностей, наблюдаемых в другой выборке.

Следовательно, для этой выборки нужно строить другую модель, а значит, и само моделирование практически теряет смысл, так как главное назначение модели – распространение закономерностей, подмеченных в выборке, на всю генеральную совокупность (что и является основой решения задач планирования, прогноза, диагностики).

В качестве альтернативного рассмотрим подход, предусматривающий

тщательный предмодельный профессиональный анализ локальных закономерностей, в соответствии с которыми формируется закон распределения заработной платы.

Эти закономерности (мультипликативный характер редукции труда, принцип оплаты по труду, постоянство относительного варьирования

заработной платы при переходе от работников одной категории сложности труда к другой и т. п.) позволяют уже на следующем, третьем этапе моделирования теоретически (т. е. без апелляции к имеющейся у нас эмпирической функции плотности) обосновать выбор класса моделей, в пределах которого мы должны оставаться при подборе искомой модельной плотности.

В рассмотренном примере таким классом будет класс логарифмически-

нормальных распределений.

После этого мы переходим к статистическому оцениванию параметров, участвующих в записи законов этого класса, т. е. переходим к четвертому этапу.

Модель, полученная таким образом, как правило, несколько хуже (по формальным критериям), чем предыдущая, аппроксимирует эмпирическую плотность, построенную по данной конкретной выборке.

Однако в отличие от модели, полученной в результате формальной статистической подгонки экспериментальных данных под одну из теоретических кривых, она остается устойчивой, инвариантной по отношению к смене выборок, т. е. она одинаково хорошо может описывать характер распределения, наблюдаемого в различных выборках из одной и той же генеральной совокупности.

А если все-таки моделирование, идущее от более или менее бесспорных

(быть может, частично подтвержденных экспериментом) исходных предпосылок о физической природе изучаемого явления, дает результаты, плохо согласующиеся с реальной действительностью?

Причина этого (при условии аккуратного проведения третьего и четвертого этапов) одна: плохое соблюдение на практике всех (или части) принятых при моделировании в качестве априорных допущений исходных предпосылок.

Оценка же этого явления может быть двоякой: если заложенные в основание модели исходные допущения признаются специалистами объективными закономерностями, в соответствии с которыми должен функционировать механизм исследуемого явления, то следует искать и устранять причины, приведшие к нарушению этих закономерностей; если же принятые допущения были результатом вынужденного упрощения на самом деле плохо различимого механизма, то следует усовершенствовать эти допущения, что приведет, естественно, и к изменению модели.

Соседние файлы в папке Лекции с прошлого семестра