Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы теории случайных процессов (4 семестр).doc
Скачиваний:
263
Добавлен:
09.04.2015
Размер:
4.95 Mб
Скачать

3.8. Преобразование распределений к нормальному

Если исследователь использовав методы, изложенные в предыдущем параграфе, убедился, что гипотеза нормальности распределения не может быть принята, то вполне может быть, что с помощью существующих методов удастся так преобразовать исходные данные, что их распределение будет подчиняться нормальному закону распределения. Для пояснения идеи преобразований рассмотрим качественный пример. Пусть кривая распределения f(x) имеет вид, представленный на рис. 3.7, т.е. имеется очень крутая левая ветвь и пологая правая. Такое распределение отличается от нормального.

Для выполнения операций преобразования каждое наблюдение трансформируется с помощью логарифмического преобразования При этом левая ветвь кривой распределения сильно растягивается и распределение принимает приближенно нормальный вид. Если при преобразовании получаются значения, расположенные между 0 и 1, то все наблюдаемые значения для удобства расчетов и во избежание получения отрицательных параметров необходимо умножить на 10 в соответствующей степени, чтобы все вновь полученные, преобразованные значения были больше единицы, т.е. необходимо выполнить преобразования

Рис. 3.7. Преобразование функции f(x) к нормальному распределению

Асимметричное распределение с одной вершиной приводится к нормальному преобразованием В отдельных случаях можно применять и другие преобразования:

а) обратная величина

б) обратное значение квадратных корней

Преобразование "обратная величина" является наиболее "сильным". Среднее положение между логарифмическим преобразованием и "обратной величиной" занимает преобразование "обратное значение квадратных корней".

Для нормализации смещенного вправо распределения служат, например, степенные преобразования При этом для a принимают значения: а=1,5 при умеренном и а=2 при сильно выраженном правом смещении. Рекомендуем читателю придумать такие преобразования, которые удовлетворяли бы исследователя в том или ином случае.

а ограничено? Рассмотрим в дальнейшем методологию решения этой

4. Анализ результатов пассивного эксперимента. Эмпирические зависимости

4.1. Характеристика видов связей между рядами наблюдений

На практике сама необходимость измерений большинства величин вызывается тем, что они не остаются постоянными, а изменяются в функции от изменения других величин. В этом случае целью проведения эксперимента является установление вида функциональной зависимости =f(X). Для этого должны одновременно определяться как значенияX, так и соответствующие им значения, а задачей эксперимента является установление математической модели исследуемой зависимости. Фактически речь идет об установлениисвязимежду двумя рядами наблюдений (измерений).

Определение связи включает в себя указание вида модели и определения ее параметров. В теории экспериментов независимые параметры X=(x1, ..., xn) принято называтьфакторами, а зависимые переменные y –откликами. Координатное пространство с координатами x1, x2, ..., xi, ..., xnназываетсяфакторным пространством. Эксперимент по определению вида функции

(4.1)

где x – скаляр, называется однофакторным. Эксперимент по определению функции вида

=f(X), (4.1а)

где X=(x1, x2, ..., xi, ..., xk) – вектор, – многофакторным.

Геометрическое представление функции отклика в факторном пространстве является поверхностью отклика. При однофакторном эксперименте k=1 поверхность отклика представляет собой линию на плоскости, при двухфакторном k=2 – поверхность в трехмерном пространстве.

Связи в общем случае являются достаточно многообразными и сложными. Обычно выделяют следующие виды связей.

Функциональные связи(или зависимости). Это такие связи, когда при изменении величиныXдругая величинаYизменяется так, что каждому значению xiсоответствует совершенно определенное (однозначное) значение yi (рис.4.1а). Таким образом, если выбрать все условия эксперимента абсолютно одинаковыми, то повторяя испытания получим одну и ту же зависимость, т.е. кривые идеально совпадут для всех испытаний.

К сожалению, таких условий в реальности не встречается. На практике не удается поддерживать постоянство условий (например, колебания физико-химических свойств шихты при моделировании процессов тепломассопереноса в металлургических печах). При этом влияние каждого случайного фактора в отдельности может быть мало, однако в совокупности они существенно могут повлиять на результаты эксперимента. В этом случае говорят о стохастической (вероятностной) связи между переменными.

Рис.4.1.Виды связей: а – функциональная связь, все точки лежат на линии; б – связь достаточно тесная, точки группируются возле линии регрессии, но не все они лежат на ней; в – связь слабая

Стохастичность связисостоит в том, что одна случайная переменнаяYреагирует на изменение другойXизменением своего закона распределения (см. рис. 4.1б). Таким образом, зависимая переменная принимает не одно конкретное значение, а некоторое из множества значений. Повторяя испытания мы будем получать другие значения функции отклика и одному и тому же значению x в различных реализациях будут соответствовать различные значения y в интервале [xmin; xmax]. Искомая зависимостьможет быть найдена лишь в результате совместной обработки полученных значений x и y.

На рис.4.1б эта кривая зависимости, проходящая по центру полосы экспериментальных точек (математическому ожиданию), которые могут и не лежать на искомой кривой , а занимают некоторую полосу вокруг нее. Эти отклонения вызваны погрешностями измерений, неполнотой модели и учитываемых факторов, случайным характером самих исследуемых процессов и другими причинами.

При анализе стохастических связей можно выделить следующие основные типы зависимостей между переменными.

1. Зависимости между одной случайной переменной Xот другой случайной переменнойYи их условными средними значениями называютсякорреляционными. Условное среднееi– это среднее арифметическое для реализации случайной величиныYпри условии, что случайная величинаX принимает значениеi.

2. Зависимость случайной переменной Yот неслучайной переменнойXили зависимость математического ожидания Myслучайной величиныYот детерминированного значенияXназываетсярегрессионной. Приведенная зависимость характеризует влияние изменений величиныXна среднее значение величиныY.

Стохастические зависимости характеризуются формой, теснотой связи и численными значениями коэффициентов уравнения регрессии.

Форма связиустанавливает вид функциональной зависимости=f(X) и характеризуетсяуравнением регрессии. Если уравнение связи линейное, то имеем линейную многомерную регрессию, в этом случае зависимостиYотXописываются уравнением прямой линии в k-мерном пространстве

(4.2)

где b0, ..., bj, ..., bk– коэффициенты уравнения. Для пояснения существа используемых методов ограничимся сначала случаем, когда x скаляр. В общем случае виды функциональных зависимостей в технике достаточно многообразны: показательные, логарифмическиеи т.д.

Заметим, что задача выбора вида функциональной зависимости – задача неформализуемая, т.к. одна и та же кривая на данном участке примерно с одинаковой точностью может быть описана самыми различными аналитическими выражениями. Отсюда следует важный практический вывод. Даже в наш век ПЭВМ принятие решения о выборе той или иной математической модели остается за исследователем. Только экспериментатор знает, для чего будет в дальнейшем использоваться эта модель, на основе каких понятий будут интерпретироваться ее параметры.

Крайне желательно при обработке результатов эксперимента вид функции =f(X) выбирать исходя их условия соответствия физической природе изучаемых явлений или имеющимся представлениям об особенностях поведения исследуемой величины. К сожалению, такая возможность не всегда имеется, так как эксперименты чаще всего проводятся для исследования недостаточно или неполно изученных явлений.

Рис.4.2. Корреляционное поле

При изучения зависимости =f(X) от одного фактора при заранее неизвестном виде функции отклика для приближенного определения вида уравнения регрессии полезно предварительно построить эмпирическую линию регрессии (рис.4.2). Для этого весь диапазон изменения x на поле корреляции разбивают на равные интервалыx. Все точки, попавшие в данный интервалxj, относят к его середине. Для этого подсчитывают частные средние для каждого интервала

(4.3)

Здесь nj– число точек в интервалеxj, причем, где k* – число интервалов разбиения, n – объем выборки.

Затем последовательно соединяют точки отрезками прямой. Полученная ломаная называетсяэмпирической линией регрессии. По виду эмпирической линии регрессии можно в первом приближении подобрать вид уравнения регрессии=f(X).

Под теснотой связипонимается степень близости стохастической зависимости к функциональной, т.е. это показатель тесноты группирования экспериментальных данных относительно принятого уравнения модели (см. рис. 4.1б). В дальнейшем уточним это положение.