- •Т.Л. Качалова, б.Ф. Фомин
- •Предисловие авторов
- •1. Новый уровень решений системных проблем
- •2. Универсальный сценарий решения системных проблем
- •4. Системное знание
- •4.1. Статистический портрет
- •4.2. Структурный портрет
- •4.3. Системный портрет типа
- •5. Общесистемное решение
- •5.1. Реалистичный портрет
- •5.2. Интерпретированный концепт системы
- •6. Сценарий системных реконструкций
- •1. Новый уровень решения системных проблем 9
- •2. Универсальный сценарий решения системных проблем 14
- •3. Эмпирическое описание 20
- •4. Системное знание 26
- •5. Общесистемное решение 103
- •6. Сценарий системных реконструкций 133
4. Системное знание
4.1. Статистический портрет
Статистический портрет дает развернутое статистическое описание эмпирического среза системы, отображает типические проявления ее изменчивости, фиксирует общие закономерности явления, но не его системные законы, табл. 2.
Объект «Показатель» раскрывает реальный факт проявления сущности системы в каком-то одном ее измерении на уровне первичного анализа признакового пространства системы, рис. 7.
Выборка данных - вектор значений показателя, полученных в процессе наблюдений, измерений и вычислений.
Объем выборки - количество значений показателя в выборке.
Вариационный ряд - множество упорядоченных по возрастанию значений показателя.
Статистическая оценка - функция результатов наблюдений, предназначенная для статистического оценивания неизвестных характеристик и параметров распределения вероятностей, рис. 8.
Минимальное и максимальное значения - крайние левый и правый элементы вариационного ряда.
Размах - диапазон значений вариационного ряда.
Функция распределения - вероятность того, что значение показателя, являющегося случайной величиной, не превосходит заданного значения действительного числа.
Плотность распределения - производная функции распределения; характеризует плотность, с которой значения показателя распределены в заданной точке.
Кривая распределения - кривая, изображающая плотность распределения.
Среднее арифметическое - мера «центрального положения» наблюдаемого показателя. Сумма значений показателя, деленная на объем выборки.
Дисперсия - характеристика рассеяния значений показателя; мера среднего отклонения значений показателя от среднего арифметического.
Среднее квадратическое отклонение — квадратный корень из дисперсии.
Стандартная ошибка среднего - среднее квадратическое отклонение среднего.
Коэффициент вариации - мера относительной изменчивости; отношение среднего квадратического отклонения к среднему арифметическому.
Асимметрия - мера несимметричности распределения; несет информацию о различии между положительными и отрицательными отклонениями значений показателя от среднего арифметического; для симметричных распределений обращается в нуль.
Эксцесс - мера островершинности распределения по отношению к нормальному; эксцесс нормированного нормального распределения равен 3.
Мода - значение, наиболее часто встречающееся в выборке (наиболее вероятное значение); соответствует максимуму кривой распределения.
Унимодальное распределение - одновершинное распределение; распределение вероятностей с одной модой.
Мультимодальное распределение - распределение вероятностей с несколькими модами. Мультимодальность может показывать, что выборка не является однородной и наблюдения порождены двумя или более распределениями.
Табулирование - определение частоты встречаемости в выборке каждого значения показателя. Табулирование данных может быть выполнено для показателей, измеренных на номинальных или порядковых шкалах с небольшим числом уровней значений. Результаты подсчета частот могут быть использованы для локализации грубых ошибок при подготовке данных, рис. 9.
Группирование — разбиение вариационного ряда на несколько интервалов группировки.
Варианты группирования - группирование по методу равных интервалов, по методу равных частот, путем выбора границ интервалов значений.
Интервал группировки - диапазон значений показателя, ширина которого зависит от размаха вариационного ряда и заданного количества интервалов.
Количество интервалов группировки - зависит от числа членов вариационного ряда и наличия в нем повторяющихся значений.
Частота значений - отношение числа значений показателя в каком-то одном интервале группировки к объему выборки.
Накопленная частота — сумма частот значений до заданного интервала группировки.
Гистограмма - графическое изображение группированного распределения. Построение гистограмм осуществляется для показателей, измеренных на интервальных шкалах. В качестве абсциссы берется значение показателя, в качестве ординаты - частота значений, деленная на длину интервала группировки. При равных интервалах группировки деление обычно опускается, а в качестве ординаты используются частота значений или число значений. Гистограммы имеют, как правило, вид ступенчатой функции или столбчатой диаграммы, рис. 10.
Полигон частот - графическое представление распределения. Для группированного распределения строится путем соединения наименьшими отрезками прямой точек, абсциссы которых соответствуют границам интервалов, а ординаты - частотам значений в этих интервалах.
Полигон накопленных частот - графическое представление распределения; строится путем соединения наименьшими отрезками прямой точек, абсциссы которых соответствуют значениям показателя, а ординаты - накопленным частотам. Для группированного распределения абсциссами считаются границы интервалов, а соответствующие накопленные частоты - ординатами, рис. 11.
Критерии проверки нормальности - оценивают близость распределения значений показателя к нормальному закону.
Визуальный способ проверки нормальности - наложение теоретической кривой нормального распределения, построенной по полученным выборочным характеристикам (среднему арифметическому и среднему квадратическому отклонению) на гистограмму распределения, рис. 12.
Нормальный вероятностный график - графическое изображение негруппированного распределения на вероятностной бумаге, имеющей специальную шкалу на оси ординат; используется для визуальной проверки соответствия закона распределения нормальному закону и наличия выбросов. Для нормального распределения график имеет вид прямой линии. Отклонение от прямой свидетельствует о несоответствии закона распределения нормальному. Аномальные значения показателя просматриваются на «хвостах» распределения, рис. 14.
Аномальные выбросы — отдельные резко выделяющиеся значения показателя. Аномальные выбросы могут быть объяснены допустимыми колебаниями значений показателя или ошибками, возникающими при сборе информации. В последнем случае аномальные значения необходимо исключить из выборки данных.
Способы обнаружения выбросов - основаны на выделении аномальных наблюдений в зонах больших и малых значений показателя по нормальному вероятностному графику, по гистограмме распределения, рис. 15, с помощью аналитических методов с 5-процентным уровнем значимости, табл. 3. Возможно также выделение областей аномальных значений по смысловому содержанию показателя.
Квантиль - значение показателя, отделяющее определенную долю элементов вариационного ряда.
Медиана — значение показателя, делящее вариационный ряд на две равные по численности элементов части. При четном числе элементов вариационного ряда за медиану берется среднее арифметическое двух центральных элементов.
Квартиль нижняя и верхняя — частный случай квантили в случае деления вариационного ряда на четыре равные по численности элементов части.
Группирование по методу равных частот - задание интервалов значений на базе квантилей (квартилей, медиан); используется для интервальных показателей.
Таблица частот - способ представления распределения, группированного на базе квантилей, рис. 16.
Величина показателя малая - диапазон значений показателя, у которого нижняя граница совпадает с минимальным значением, а верхняя граница устанавливается равной нижней квартили; для интервальных показателей с малым объемом выборки вместо квартилей используется медиана.
Величина показателя большая - диапазон значений показателя, у которого нижняя граница устанавливается равной верхней квартили, а верхняя граница совпадает с максимальным значением; для интервальных показателей с малым объемом выборки вместо квартилей используется медиана.
Главной проблемой применения объекта «Показатель» является анализ на его основе представительности данных с учетом следующих положений:
репрезентативная выборка значений показателя обеспечивает статистическую проявленность определенного аспекта системы;
повторяемость значений количественного показателя уменьшает степень объективности проявления системы;
типические и особенные аспекты системы передаются полными наборами статистических характеристик.
Объект «Таблица наблюдений» задает целокупность наблюдаемых величин, осознаваемую через имена, значения и развернутые комментарии всех отдельно взятых показателей.
Имя - символическое обозначение показателя.
Вектор значений показателя - столбец таблицы наблюдений, содержащий целые или вещественные числа и, возможно, пропуски данных; характеризует индивидуальные особенности единичных объектов; воспринимается как канал проявления системы во всем разнообразии ее типического и особенного; одномерный взгляд на систему, в котором скрыты следы всех других показателей, рис. 17.
Развернутый комментарий - краткая характеристика предметного содержания показателя (методика наблюдения и измерения, единицы измерения, шкала измерения, способ кодирования значений и т.д.), табл. 4.
Пропуски данных - неизвестные значения показателей; допускаются, если они непреднамеренные.
Шкалы измерений - номинальные, порядковые, интервальные.
Количество наблюдений - число единичных объектов наблюдений, рассматриваемых в эмпирическом опыте в качестве носителей идеи системы.
Количество показателей — общее количество показателей, включенных в исходное эмпирическое описание.
Таблица описательных статистик - таблица, содержащая объем выборки, минимальное и максимальное значения, размах, среднее арифметическое, среднее квадратическое отклонение и коэффициент вариации для каждого интервального показателя, табл. 5.
Сводная табуляграмма - таблица, содержащая частоты встречаемости в выборке значений всех номинальных и порядковых показателей, табл. 6.
Таблица группировок данных - представление распределения значений категориальных (номинальных) показателей в выборке; для интервальных показателей
в качестве категорий выступают интервалы группировки; количество интервалов и их ширина выбираются одинаковыми для всех показателей, табл. 7.
Группирование - таблица, содержащая объем выборки, количество групп, минимальное и максимальное значения, медиану, нижнюю и верхнюю квартили для каждого интервального показателя, табл. 8.
Большие и малые значения показателей - таблица, содержащая границы областей больших и малых величин для каждого интервального показателя, табл. 9.
Трехвходовая гистограмма - распределение значений группы показателей по значениям группирующего параметра. В качестве группирующего параметра могут выступать один или более категориальных или порядковых показателей. Если группирующий параметр формируют несколько показателей, то получаемые в результате области значений не должны перекрываться, рис. 18.
Главной проблемой применения объекта «Таблица наблюдений» является проверка полноты данных. Ее результат выражается числом и составом наиболее существенных показателей каждого уровня восприятия проявленной сущности
системы, создающих в своей совокупности ее исчерпывающий панорамный внешний образ.
Технологические индикаторы. Таблица данных воспринимается как единое целое, скрывающее в себе потенциал системы, реализация которого при реконструкции сложного позволяет раскрывать смыслы проблемы. Статистический портрет используется в качестве базы реконструктивного анализа, содержащей набор независимо рассматриваемых показателей вместе с их значениями и вычисленными статистиками, применяемыми для оценки возможности включения каждого отдельно взятого показателя в базу анализа.
Аппарат технологических индикаторов статистического портрета оценивает полноту и представительность исходного эмпирического описания для раскрытия проблемы в общесистемном решении через:
количество пропусков данных, ухудшающих выражение системы в целом, рис. 19;
корректность значений всех показателей, табл. 10;
выявление и исключение неизменяющихся показателей, табл. 11
проверку и улучшение группировок, табл. 12
оценку многовидности изменчивости показателей;
оценку существенности (необходимости) показателей;
полноту и представительность выражения системы в данных.
Статистический портрет охватывает все единичные объекты наблюдения, взятые независимо один от другого, и отображает их во множество значений основных показателей, каждый из которых воспринимается на этом шаге независимо друг от друга. Любой показатель задается помимо совокупности его отдельных значений полным набором статистических характеристик.
Резюме статистического портрета (на примерах двух проектов). Статистический портрет отображает проявления проблемы через изменчивость показателей состояния единого носителя информации о проблеме. Основная задача портрета состоит в обеспечении корректности данных и проверке самодостаточности эмпирического описания.
Проект: Конкурентоспособность, качество, техническая и экологическая безопасность продуктов и технологий производства
Технологические индикаторы Общая оценка портрета Результаты
Исходных показателей: 59, из них 3 по- Система данных в смысле ее Получено развернутое стати-
казателя - идентификаторы стального полноты и представительности стическое описание проблемы
листа может служить достаточным качества продуктов и техноло-
На базе 10 показателей сформированы 5 эмпирическим основанием для гий металлургического произ-
новых вычисляемых показателей получения общесистемного водства
Мало данных: 2 показателя решения проблемы Установлен факт соответствия
Информативных показателей: 49 Большое число количествен- выпускаемых продуктов тре-
Показателей с аномальными значения- ных показателей (98%) - по- буемым нормам и стандартам
ми: 16 (от 1 до 5 выбросов) ложительный факт для вери- рынка по списку сдаточных
Объемы выборок: от 158 до 288 фикации общесистемного ре- показателей (11 характеристик
Пропуски в таблице наблюдений: есть шения проблемы химического состава металла
Полных строк в таблице наблюдений: 4 Большое число пропусков в и 3 показателя механических
Полных строк по сдаточным показате- таблице наблюдений может свойств стального листа)
лям: 4 затруднить оценку статиста- Установлено нарушение вос-
Показателей с достаточными объемами ческих взаимосвязей между производимости процессов
выборок: 49 показателями производства стального листа
Распределения сдаточных показателей: (законы распределения всех
не нормальныесдаточных показателей - не
Шкалы измерений: интервальные - 98%; нормальные)
номинальные - 2%
Проект: Технология снижения затрат и ускорения хозяйственных механизмов производства Технологические индикаторы Общая оценка портрета Результаты
Показателей: 179, из них 1 показатель - Система данных в смысле ее Получено развернутое стати- идентификатор заказа полноты и представительности стическое описание системы
104 показателя имеют аномальные зна- может служить достаточным позаказного управления ма- чения (от 1 до 9 аномальных выбросов) эмпирическим основанием для шиностроительным производ- Выборки варьируют от 0 до 1541 получения общесистемного ством
Распределение показателей по объему решения проблемы Система производственного
выборки: Большое число качественных аппарата предприятия выра-
6 показателей - 0; 23 показателя - до показателей (39%) - отрица- жена через 172 показателя 500; 38 показателей - от 500 до 1000; тельный факт для верифика- Выявлен большой разброс 72 показателя - от 1000 до 1500; 39 ции общесистемного решения значений для показателей, показателей - более 1500 проблемы характеризующих практиче-
149 показателей имеют оптимальные Большое число пропусков в ски все этапы жизненного выборки таблице наблюдений может цикла заказа
Дублирующие показатели: 3 затруднить оценку статисти-
Информативные показатели: 169 ческих взаимосвязей между
Все распределения не нормальные показателями
Шкалы измерений: интервальные - 61%; Малые объемы выборок за- номинальные - 39% труднят верификацию обще-
системного решения Для 49 показателей характерны большие значения коэффициента вариации (> 3) Большая доля показателей (104 из 172) с аномальными значениями
В полном статистическом портрете представлены результаты статистического анализа эмпирического среза проблемы, характеризующие статистические свойства показателей, полноту и представительность эмпирического описания. Оценена достаточность этого описания для проведения полного системного исследования проблемы.