Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1033.pdf
Скачиваний:
32
Добавлен:
15.11.2022
Размер:
8.08 Mб
Скачать

3.6. Задачи распознавания образов в геологии

Многие прогнозные и интерпретационные задачи решаются в практической геологии путем сопоставления комплекса признаков изучаемого объекта с комплексом тех же признаков эталонного объекта. Совокупность подобных методов, основанных на принци­ пе аналогии, получила название методов распознавания образов.

Проблема распознавания образов геологических объектов тес­ но связана с проблемой их классификации по совокупности извест­ ных признаков. С позиций многомерного математического анализа реальному геологическому объекту ставится в соответствие набор действительных чисел дгь лг2, ..., JCw, которые выражают значения его измеренных геологических, геохимических или геофизических его признаков. Каждая совокупность таких чисел интерпретируется как вектор или точка в многомерном пространстве, а множествам объ­ ектов одного класса в пространстве признаков соответствуют неко­ торые множества точек.

Области многомерного пространства, в которых сосредоточены точки одного класса, называются собственными областями классов. Если объекты тождественны друг другу, их собственные области совпадают. Собственные области объектов, резко отличающихся друг от друга, не пересекаются в пространстве. Для объектов, близ­ ких по некоторым признакам, характерно большее или меньшее пе­ ресечение их собственных областей.

Разделение непересекающихся собственных областей двух классов возможно с помощью гиперповерхностей (в трехмерном пространстве - плоскостей, в двухмерном - линий), а для разделе­ ния пересекающихся областей необходимо отыскать решающую функцию, минимизирующую возможность принятия ошибочного решения.

Статистический подход к классификации объектов основан на байесовской теории принятия решений. В терминах этой теории «состояние природы» А может быть охарактеризовано вероятно­ стью Р(А1) и условной вероятностью Р(Х/А,). Под условной вероят­ ностью подразумевается вероятность того, что совокупность при­ знаков объекта примет значение Х9когда состояние природы будет Aj (то есть объект будет относиться к классу Л,). Если удается оце­

нить априорную Р(А) и условную Р(Х/А) вероятность, можно пред­ сказать свойственное объекту состояние природы в зависимости от того, какое значение X примут характеризующие его признаки:

Р(А/)Р(Х / А/)

P(Ai / X ) = т

^ Р ( А ,) Р ( Х / А,)

где т - число возможных состоянии природы (то есть классов).

Для совокупностей многомерных

статистических признаков

геологических объектов заранее не известно, пересекаются их соб­ ственные области или нет, в связи с чем допускается возможность их пересечения. В качестве меры пересечения Ф используется про­ изведение условных вероятностей Ф = Р ( XI А,) Р (XI Aj), где Р (XI А/) - вероятность попадания точки X в область пересечения при ус­ ловии, что она относится к классу А -,; P(X/Aj) - то же при условии, что она относится к классу Aj.

Правило, в соответствии с которым производится разграниче­ ние объектов на классы, называется решающим правилом. Для его реализации в общем случае подыскивается система разделяющих функций gi(A'), &(Х), ..., gm(X). Если g,(X) > gj(X), точка X принадле­ жит к Aj и наоборот. Если g,(X) = g/X), то области Л, и Aj соприка­ саются. Если при подстановке признаков Хтокажется, что для всех / Ф j соблюдается неравенство g/(X) > g,(X), то можно утверждать принадлежность объекта к классу /.

Для нормального распределения признака / g,{X) = - (х - Зс,)2 /

12а2 Задача обучения распознаванию образов сводится к подбору математической модели алгоритма аппроксимации и построению в пространстве признаков некоторой поверхности (в общем случае - гиперплоскости), разделяющей множества точек, которые соответ­ ствуют различным классам объектов, или к отысканию решающей функции.

Модели распознавания образов геологических объектов весьма разнообразны. При решении конкретных геологических задач их выбор зависит от природы геологических объектов, числа, полноты описания эталонных объектов, типов и информативности их при­

знаков. В зависимости от типов исходных признаков выделяют две группы моделей: дискретные и непрерывные. Дискретные модели применяются в тех случаях, когда измеряемые признаки рассматри­ ваются как независимые или частично зависимые детерминирован­ ные величины. Непрерывные модели используются для распознава­ ния образов таких объектов, измеряемые признаки которых могут рассматриваться как случайные величины и поддаются статистиче­ скому описанию многомерными функциями плотностей вероятности.

В качестве критериев оптимальности распознавания использу­ ются решающие правила, определяющие пороговые значения ре­ шающих функций. Они могут определяться статистическими, логи­ ческими или эвристическими методами.

Для целей эффективного использования математических мето­ дов распознавания образов необходимо последовательно решить несколько взаимосвязанных задач: выбрать эталонные объекты, признаки и методы распознавания; построить решающее правило и провести классификацию контрольных объектов. Лишь после по­ лучения удовлетворительных результатов такой классификации можно приступать к распознаванию образов новых объектов.

При выборе эталонных объектов (формировании выборки обу­ чения) следует помнить: использование статистических алгоритмов распознавания требует, чтобы число объектов в выборке обучения было в несколько раз больше числа признаков. Чем больше неиз­ вестных параметров (например, средних значений и дисперсий при­ знаков), которые требуют определения в процессе обучения, тем больше должна быть выборка обучения. Поэтому на практике обычно возникает проблема сокращения числа признаков и повы­ шения их информативности. При использовании алгоритмов, в ко­ торых измеренные признаки рассматриваются как детерминирован­ ные величины, число объектов в выборке обучения может быть со­ измеримым или даже меньше числа измеряемых признаков.

При выборке признаков, характеризующих особенности оцени­ ваемых геологических объектов (формировании признакового про­ странства объектов), решающее значение имеют знания и аналити­ ческие способности исследователей, от эрудиции которых зависит правильная отбраковка заведомо неинформативных и малоинфор­ мативных признаков и предельно возможное ограничение размер­ ности признакового пространства.

Эвристическими называют такие методы, когда пороговые зна­ чения решающих функций оцениваются эмпирически или с пози­ ций «здравого смысла».

Выбор метода распознавания основывается на априорных зна­ чениях специалистов-геологов и результатах предварительного ана­ лиза выборок объектов по их признаковым описаниям. В односвяз­ ных объектах классы распознаваемых объектов характеризуются многими особенностями, члены одного и того же класса располага­ ются близко, а члены различных классов - далеко друг от друга. В таких случаях применяются простые и быстродействующие ли­ нейные методы распознавания образов (разделение гиперплоско­ стью или кусочно-линейной гиперповерхностью). Если же классы состоят из подклассов, один из которых находится в окружении то­ чек другого класса {многосвязные объекты), для их распознавания используются более сложные и емкие по времени нелинейные ме­ тоды, например, полиномиальные разделяющие функции. При ис­ пользовании любых алгоритмов распознавания следует стремиться к построениям решающих функций как можно более простых ви­ дов, поскольку они легче поддаются реализации и обеспечивают более устойчивые решения, особенно при малых выборках обучения.

3.7. Статистическая оценка перспектив

рудоносности территорий

Для прогнозирования перспектив рудоносности территорий, вероятных масштабов оруденения и ожидаемых геолого-промыш­ ленных типов месторождений используются совокупности (наборы) геологических, геофизических и минералого-геохимических при­ знаков, для которых изначально установлены пространственные или временные связи с прогнозируемыми геологическими объ­ ектами.

В простейших случаях удается различить сравниваемые объек­ ты по суммам кодируемых признаков. В таких схемах различающая способность (информативность) каждого из признаков изучается и оценивается раздельно с помощью условных балльных оценок, коэффициентов парной линейной или ранговой корреляции и дру­ гими способами. Однако, оценивая информативность каждого при-

знака изолированно, нельзя получить характеристики их суммарной эффективности, поскольку месторождения полезных ископаемых представляют собой сложные геологические системы, сформиро­ ванные под совокупным влиянием многих рудообразующих факто­ ров. Для оценок их важнейших пространственно-временных связей необходимо выявление суммарного эффекта доминирующих рудо­ образующих факторов. Используя более совершенные схемы распо­ знавания перспективных площадей или крупномасштабных рудных объектов с применением человскомашинных методов предвари­ тельного преобразования признаков, принятия оптимальных реше­ ний и оценки их надежности, можно заметно повысить информа­ тивность используемых исходных данных. При этом, однако, во­ просы выбора объектов и территорий прогноза, элементарных участков прогнозирования, совокупностей исходных признаков и систем их описания основываются прежде всего на существующем опыте человекомашинного прогнозирования и геологической эру­ диции исполнителей.

Обычно за элементарные участки прогноза принимаются квад­ ратные и прямоугольные ячейки, размеры которых определяются средними размерами прогнозируемых объектов, целями и масшта­ бами проводимых исследований. Как правило, площади элементар­ ных ячеек измеряются на картах любых масштабов квадратными сантиметрами или их долями. Для описания элементарных участков выбираются признаки, наиболее тесно связанные с проявлениями процесса оруденения и масштабами рудных образований. Это могут быть наборы детерминированных признаков, характеризующих ли­ тологический, гранулометрический, петрографический или мине­ ральный состав полезных ископаемых и вмещающих их пород, их стратиграфическое положение или формационную принадлежность, пространственные связи с тектоническими или вулкано тектониче­ скими структурами линейного или центрального типов, метасоматитами или гидротермалитами соответствующих масштабов прояв­ ления или стохастических характеристик различных свойств полез­ ных ископаемых и вмещающих их пород.

Полученный массив описаний разбивается на несколько сово­ купностей: эталонная выборка перспективных объектов (месторож­ дений, рудных полей и др.); эталонная выборка неперспективных

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]