Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СА_пособие.doc
Скачиваний:
46
Добавлен:
28.04.2019
Размер:
2.19 Mб
Скачать

4.3. Обработка экспериментальных данных

Результаты любого эксперимента фиксируют в той или иной фор­ме, затем их используют с целью обработки. Операции сбора и обра­ботки в одних случаях могут быть совмещены во времени, в других случаях обработка экспериментальных данных является самостоятель­ным этапом. Практически совмещенными во времени сбор и обработ­ка данных являются в автоматизированных системах управления науч­ными исследованиями и комплексными испытаниями, проводимыми в реальном масштабе времени. Отдельным этапом работ обработка дан­ных выступает при проведении учебных экспериментов, на этапе обоб­щения результатов научных исследований, при проведении системного анализа.

Методы обработки экспериментальной информации зависят от того, какова модель, для уточнения которой проводится эксперимент. Фак­тически обработка экспериментальных данных - это преобразование информации к виду, удобному для использования, перевод результатов наблюдений с языка измерений на язык уточняемой модели. Модель, в свою очередь, может принадлежать к одному из двух типов: классифи­кационным или числовым моделям. Тип моделей зависит от знаний об объекте, для которого строится модель. Знания могут быть как перво­начальными, приближенными, так и достаточно полными, хорошо структурированными, хотя и требующими уточнения. Классификаци­онная модель носит качественный характер, хотя в ней могут участво­вать и количественные переменные. Например, классифицируют состо­яние объекта «работоспособен - неработоспособен» по результатам численных измерений параметров. С другой стороны, в числовых мо­делях часть переменных может измеряться в слабых шкалах. Рассмот­рим особенности экспериментальных данных и их обработки для обо­их типов моделей.

Классификационные модели являются первичными, исходными формами знания. Человек в своей повседневной деятельности, сталки­ваясь с новыми явлениями или предметами, очень часто их распознает, т.е. без особых затруднений относит к тому или иному классу. Увидев животного неизвестной породы, человек тем не менее относит его к определенному типу животных. Человек может читать рукописи, напи­санные разными людьми, хотя каждый из них имеет свой почерк. Люди узнают своих знакомых даже в случае, если те поменяли прическу, одеж­ду, нанесли макияж. Таким образом, человек выделяя основные призна­ки, способен относить объекты к тому или иному классу, т.е. решать задачу классификации.

Необходимость решения задачи классификации проявляется во многих сферах человеческой деятельности. Ряд профессий связан ис­ключительно с умением правильно классифицировать ситуации. От врачей требуется умение правильно поставить диагноз больному, кри­миналисты занимаются идентификацией почерка, археологи устанав­ливают принадлежность найденных предметов определенной эпохе, геологи по косвенным данным определяют наличие и характер полез­ных ископаемых. В каждом из перечисленных видов деятельности про­является умение человека правильно отнести наблюдаемый объект к тому или иному классу. Также и в науке, познание начинается со срав­нения изучаемого объекта с другими, выявления сходства и различия между ними.

Для построения классификационных моделей решают следующие типы задач: кластеризации, классификации или распознавания образов, упорядочивание объектов и уменьшение размерности модели.

Задача кластерного анализа характеризуется следующими услови­ями: считается, что и границы классов в пространстве признаков, и число классов являются неизвестными. Требуется определить классы исходя из близости, похожести или различия описаний объектов xi=(xi0, xi1,...,xin). Компоненты вектора Х - признаки кластера, значения которых подлежат определению.

В задаче классификации или распознавания образов число клас­сов считается заданным. Если границы между классами заданы, то имеем априорную классификацию, если границы требуется оценить по классификационным примерам, то задача будет называться распозна­ванием образов по обучающей выборке. Целевой признак имеет зна­чения в номинальной шкале.

При решении задачи упорядочивания объектов требуется устано­вить отношение порядка между признаками объектов (или некоторой их частью) по определенному критерию предпочтения.

Задача уменьшения размерности заключается в следующем. Клас­сификационные модели могут учитывать множество предположений, которые еще надо проверить. Список признаков cформируется эврис­тически и может содержать дублирующие признаки. Поэтому задача состоит в совершенствовании классификационных моделей, в умень­шении размерности модели с помощью отбора наиболее информатив­ных признаков или путем формирования обобщенных признаков.

Числовые модели отличаются от классификационных рядом особен­ностей:

  1. целевые признаки х0 измеряются в числовых шкалах;

  2. числа х0 представляют собой функционалы или функции призна­ков переменных, которые не обязательно имеют числовые выражения;

  3. в числовых моделях переменные могут зависеть от времени.

Если в задаче классификации для получения экспериментальной ин­формации необходимо организовывать наблюдения за группой однотип­ных объектов, то в задаче построения числовых моделей в качестве первичной информации могут присутствовать результаты длительных наблюдений за одним объектом или небольшой по объему группой од­нотипных объектов. Числовые модели могут задавать связь между пе­ременными как в виде параметрических, так и в виде непараметричес­ких зависимостей. Типичными задачами для числовых моделей явля­ются задачи косвенных измерений и поиска экстремума.

В задаче косвенных измерений (или как ее еще называют задачей оценки параметров) требуется по результатам наблюдений {xij} оценить параметр x0. В отличие от задачи классификации х0 измеряется не в номинальной шкале, а в числовой. Если статистические данные {xij} представляют собой результаты наблюдения до некоторого момента времени t0, а х0 требуется оценить для момента t>t0, то задача оценива­ния называется прогнозированием.

Задача поиска экстремума состоит в организации наблюдений за исследуемым процессом таким образом, чтобы по результатам наблю­дений можно было получить экстре­мальное значение целевого признака х0. Задачи такого рода решаются с помощью методов планирования эксперимента.