Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3 Лекция Метризованные отношения и экспертное оценивание Часть 1.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
376.83 Кб
Скачать

Инвариантность относительно допустимых преобразований шкалы измерения.

Требования к алгоритмам анализа данных. Основное требование к алгоритму анализа данных формулируется в теории измерений следующим образом: выводы сделанные на основе данных, которые измерены на шкале определенного типа, не должны изменяться при допустимом преобразовании шкалы в которой измерены эти данные. Иначе говоря выводы должны быть инвариантными в отношении допустимых преобразований шкалы.

Одна из основных целей теории измерений – борьба с субъективизмом исследователя при приписывании числовых значений реальным объектам. Выбор единиц измерения зависимый от исследователя, то есть являются субъективными.

Статистические выводы могут быть адекватными реальности лишь тогда, когда они не зависят от того, какую единицу измерений выберет исследователь, то есть когда они инвариантны к допустимым преобразованиям шкалы.

Пусть Х1, Х2, …, Хn – выборка размером n. В большинстве случаев разнообразных оцениваниях используется среднее арифметическое:

.

Использование среднего арифметического является настолько обычным, что второе слово термина часто опускают, что может привести к ошибочным выводам.

Средним значением выборки Х1, Х2, …, Хn является произвольная функция f(Х1, Х2, …, Хn), которая Min(Х1, Х2, …, Хn)f(Х1, Х2, …, Хn) Max(Х1, Х2, …, Хn), то есть при всех возможных значениях аргумента значение этой функции, не меньше чем минимальное из чисел (Х1, Х2, …, Хn) выборки, и не большее чем максимальное из этих чисел.

При допустимом преобразовании шкалы значения средней величины будут изменяться. Но выводы про то для какой выборки среднее больше, а для какой – меньше, не должны изменяться (согласно требований инвариантности выводов, которое является основным требованием в теории измерений).

Сформулируем соответствующее математическое задание поиска вида средних величин, результат сравнения которых постоянный по отношению к преобразованиям шкалы. f(Х1, Х2, …, Хn) – среднее по Каши. Среднее первой выборки меньше чем среднее второй, то есть . Тогда согласно теории измерений для постоянства результатов сравнения средних необходимо, чтобы для любого допустимого преобразования g из группы допустимых преобразований в соответствующей шкале справедливо неравенство , то есть среднее преобразованных значений первой совокупности меньше второй. Это условие должно сохраняться для любых совокупностей и , и любого допустимого преобразования g. Средние значения которые удовлетворяют такому условию называются допустимыми (в соответствующей шкале). Для данных, измеренных в шкале наименований, в качестве среднего выступает лишь мода.

Средние значения в порядковой шкале. Рассмотрим обработку утверждений экспертов, которые измеряются в порядковой шкале. В этом случае доказано, что из всех средних по Коши допустимыми средними в порядковой шкале допустимыми являются члены вариационного ряда (порядковые статистические). Это является справедливым при условии, что среднее является непрерывной и симметричной функцией. Последнее означает, что при перестановке аргументов функции значение функции не изменяется.

В качестве среднего для данных, которые измеряются в порядковой шкале, можно использовать, в том числе, медиану (при непарном объеме выборки). При парном количестве следует использовать один из двух вариационных членов вариационного ряда – левую или правую медиану. Моду так же можно использовать – она всегда является членом вариационного ряда. Но нецелесообразно рассчитывать среднее арифметическое, среднее геометрическое, потому что это не имеет смысла.

Теорема. Пусть - независимые одинаково распределенные случайные величины с функцией распределения F(x), а - независимые одинаково распределенные случайные величины с функцией распределения Н(x), при этом и независимы между собой и М[X(1)]> М[X(2)] (где М – математическое ожидание). Для того чтобы вероятность события

стремилась к 1 при Min(m,n) для любой строго возрастающей непрерывной функции g, которая удовлетворяет условию

необходимо и достаточно, чтобы для всех х выполнялось неравенство F(x)H(x), при этом существовало число х0, для которого F(x0)<H(x0).

Средние по Колмогорову. Природная система аксиом (требований к средним величинам) приводит к ассоциативным средним. Среднее по Колмогорову G(X) для чисел вычисляется по формуле

где F – строго монотонная функция (то есть строго возрастающая или строго убывающая) G=F-1 – функция, обратная F. Среднее по Колмогорову - это частный случай среднего, который обобщает несколько средних. Так, если F(x)=x, то среднее по Колмогорову – это среднее арифметическое, если F(x)=ln(x), то среднее геометрическое, если F(x)=1/x, то среднее гармоническое, если F(x)=x2, то среднее квадратичное и т.д.(в последних трех случаях сравниваются позитивные величины). С другой стороны такие популярные средние, как медиана и мода, нельзя представить в виде по Колмогорову.

Коэффициент корреляции не изменяется при любом допустимом преобразовании в шкале интервалов, как и отношение дисперсий, дисперсия не изменяется в шкале разностей, коэффициент вариаций – в шкале отношений и т.д. В теории принятия решений необходимо использовать лишь инвариантные алгоритмы обработки данных. Понятно что требование инвариантности выделяет из множества альтернатив среднее лишь некоторых, которые соответствуют шкалам измерений, которые используются.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]