Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
km_2.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.09 Mб
Скачать

2.9. Оценка по критерию согласия

Для статистической оценки гипотезы о том, что совокупность эмпирических данных незначительно отличается от той, которую можно ожидать при некотором теоретическом законе распределения, можно рассмотреть два вида испытания на соответствие. Одним из параметров, позволяющих оценить расхождение между наблюдаемыми и ожидаемыми частотами, является величина . Критерий l2 был предложен Пирсоном в 1903 г. Статистика определяется выражением

,

где fо – наблюдаемая частота для каждой группы или интервала;

fе – ожидаемая частота для каждой группы или интервала;

к – число групп или интервалов.

Если = 0, то наблюдаемое и теоретически предсказанное значение частот точно совпадает. Если же > 0, то полного совпадения нет. Чем больше величина , тем больше расхождение между наблюдаемыми и ожидаемыми значениями. Если > 0, то следует сравнить расчетные значения с табличными значениями для того, чтобы оценить, насколько наблюдаемое значение определяется только случайными причинами, при практическом использовании этой статистики высказывается так называемая нулевая гипотеза но о том, что между наблюдаемыми и ожидаемыми теоретическими распределениями с теми же параметрами нет значительных расхождений. Если при проверке этой гипотезы расчетная величина оказывается больше критического табличного значения (для данного уровня доверительной вероятности и соответствующего числа степени свободы), то можно заключить, что при данном уровне доверительной вероятности наблюдаемые частоты значительно отличаются от ожидаемых, и тогда следовало бы отвергнуть гипотезу но.

Применяя метод проверки гипотез по критерию согласия , следует помнить следующее:

1) Относительные значения частот или их значения, выраженные в процентах, брать нельзя, иными словами, следует пользоваться данными прямых наблюдений или абсолютного значения частот.

2) Значения наблюдаемых частот для каждой группы или интервала должно быть равно 5 или более. Если это не так, то смежные группы или интервалы должны объединиться.

3) Число степени свободы задается выражением v = k – 1 – m, где m – число параметров, определенных опытным путем или на основе выборочных данных для вычисления ожидаемых значений частот.

Вторым методом проверки гипотез является метод – критерий Колмогорова – Смирнова, ознакомиться с которым можно в соответствующей литературе.

2.10. Подбор кривых

Во многих подсистемах имеет место функциональная связь между двумя или более переменными, желательно эту связь выявить. Чаще всего эта связь чрезвычайно сложна или совершенно неизвестна. В этом случае мы можем столкнуться с необходимостью ввести некоторую гипотезу о характере функциональной зависимости, т.е. аппроксимировать ее некоторым относительно простым математическим выражением, например, линейным выражением или многочленом. Для поиска таких математических функциональных или структурных зависимостей между двумя или более переменными по накопленным экспериментальным данным весьма полезны методы регрессионного и корреляционного анализа. Регрессионный анализ дает возможность построить, исходя из имеющейся совокупности экспериментальных данных, уравнения, вид которых задает аналитик, а корреляционный анализ позволяет судить о том, насколько хорошо экспериментальные точки зрения согласуются с выбранным уравнением ("ложатся" на соответствующую кривую).

Первым шагом при выводе уравнения, аппроксимирующего требуемую зависимость, является сбор данных, отражающих соответствующие значения рассматриваемых переменных. Пусть, например, мы предполагаем, что выход химического процесса является функцией количества катализатора, вводимого в реактор. Обозначим через у величину выхода и через х количество вводимого катализатора, тогда из данных, регистрировавшихся прежде или полученных в результате специального эксперимента, можно взять выборку объемом N значений х1, х2,…, хN и N соответствующих значений у1, у2,…, уN.

Следующим шагом будет нанесение этих точек (х1, у1), (х2, у2),…, (хN, уN) на график в прямоугольной системе координат. В результате мы получим так называемую диаграмму разброса, из которой часто удается чисто визуальным способом найти плавную кривую, аппроксимирующую функциональную зависимость, например, из графика на рис. 2.7 видно, что экспериментальные точки хорошо ложатся на прямую линию, в то же время точки, нанесенные на рис. 2.8, лучше ложатся на некоторою кривую. Задача о нахождении для аппроксимируемых кривых таких уравнений, которые наилучшим образом отображают данную совокупность экспериментальных точек, условно называют задачей подгонки кривых по точкам.

Рис. 2.7. Рис.2.8

Прежде всего аналитик должен выбрать вид кривой, для которой он будет искать аппроксимирующее уравнение. Ниже приводится несколько наиболее распространенных видов аппроксимирующих кривых и соответствующих им уравнений (х – независимая переменная, у – зависимая переменная, остальные буквы и цифры относятся к константам или параметрам кривых):

1) у = а0 + а1х – прямая линия;

2) у = а0 + а1х + а2х2 – квадратичная парабола;

3) у = а0 + а1х + а2х2 + а3х3 – кубическая парабола;

4) у = а0 + а1х + а2х2 + а3х3 + а4х4 – парабола 4-й степени;

5) у =а0 + а1х + а2х2 + … +аnхn – парабола n-й степени;

6) у = 1/ (а0 + а1х) или 1/ у = а0 + а1х – гипербола;

7) у = авх или lg у = а0 + а1х – экспонента;

8) у = а0 + а1 lg х – логарифмическая кривая;

9) lg у = а0 + а1lg х – кубическая логарифмическая кривая.

Могут найти применение, разумеется, и кривые многих других видов. Чтобы решить, какую аппроксимацию использовать, следует изучить диаграмму разброса и сравнить ее форму с формой нескольких кривых, соответствующих различным уравнениям; форма некоторых из них показана на рис. 2.9. Иногда бывает полезно также исследовать диаграмму разброса, преобразовав переменные, для этого можно воспользоваться специальной полулогарифмической или логарифмической сеткой, на которой соответственно масштаб по одной или обеим осям координат выбран логарифмическим, при этом, например, если диаграмма разброса в системе координат х – lg у оказывается линейной, следует воспроизвести уравнением экспоненты (7). Подобным же образом, если диаграмма линейна в масштабе lg х – lg у следует взять аппроксимирующее уравнение кубической логарифмической кривой (9).

Рис. 2.9. Различные виды регрессионных кривых.

Определим. что следует понимать под “наилучшей” подгонкой кривой. Попробуем просто положиться на наш здравый смысл. Наложим на диаграмму разброса лекало и попытаемся провести кривую так, чтобы он проходила “посередине”, т.е. чтобы все точки, не попавшие на кривую, были от нее на одинаковом линейном расстоянии. Недостаток этого способа заключается в том, что каждый аналитик будет получать свои собственные кривые и аппроксимирующие их уравнения, поэтому хотелось бы выработать такой критерий “наилучшего приближения”, который был бы объективен, отвечал бы интуитивному понятию приемлемого и имел сравнительно простое математическое представление. Наиболее часто здесь используется так называемый метод наименьших квадратов, который по существу просто формализует процедуру подбора аппроксимирующей кривой на глаз, когда мы стремимся свести к минимуму отклонение экспериментальных точек от подбираемой кривой.

Рис. 2.10.

Рассмотрим пример на рис. 2.10., где через (х1, у1), (х2, у2),…, (хN, уN) обозначены координаты экспериментальных точек; для любого заданного хi будет иметь место разница между уi и соответствующим значением, получающимся по теоретической кривой. Обозначим эту разницу Дi и будем называть ее отклонением, тогда мерой качества приближения кривой к экспериментальным данным можно считать сумму абстрактных отклонений, т.е. |Д1| + |Д2| + … + |ДN|. Поскольку отклонение может быть положительным или отрицательным, с математической точки зрения проще возвести эти значения в квадрат и в дальнейшем иметь дело с квадратичными отклонениями. Сумма последних даст хорошую меру качества приближения, поэтому можно считать, что из всех возможных аппроксимирующих кривых наилучшего приближения для данной совокупности экспериментальных точек будет та, для которой сумма Д12 + Д22 + … + ДN2 минимальна. Так определяется критерий наилучшего приближения по методу наименьших квадратов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]