Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Истомин А.В. Анализ_данных.doc
Скачиваний:
2
Добавлен:
08.12.2018
Размер:
307.71 Кб
Скачать

4.2. Сведение задачи уточнения границы геологического тела к решению задачи распознавания образов

Для моделирования геологических тел различных масштабов в осадочном бассейне (ОБ) необходимо знать их границы (по латерали), не только внешние, но и внутри зоны сплошного распространения. Как показывает опыт решения многочисленных практических задач, для этого могут быть с успехом применены методы распознавания образов.

Сформулируем задачу нахождения проекции границы геологического тела на земную поверхность по косвенным признакам как задачу распознавания.

Пусть имеем двухмерную равномерную координатную сетку K, заданную в прямоугольнике Q, горизонтали и вертикали которой параллельны соответствующим осям координат,

K={(x1,y1),(x2,y2), …,(xk,yk)}.

Определение. Равномерной сеткой (гридом) G называется частично определённая вещественная функция, заданная на K.

Объекты обучения S1,…,Sm и пробы Pk, k=1,2, – вертикальные разрезы, исходящие из точек земной поверхности. Pk исходят из узлов двухмерной равномерной координатной сетки K. Для всех Si и Pk известны значения признаков X1,…,Xn.

Пусть наличие или отсутствие тела G установлено в разрезах S1,…, Sm. В первых m(1) из них тело присутствует, в остальных нет. Требуется:

1) найти решающую функцию F(u1,…,un) и число , такие, что F(X1(Si),…,Xn(Si))> при i=1,…,m(1) и F(X1(Si),…,Xn(Si))≤ при i=m(1)+1,…,m;

2) используя найденное решающее правило, распознать Pk на наличие в них тела G;

3) по результатам распознавания Pk провести искомую проекцию.

4.3. Примеры алгоритмов распознавания

К настоящему времени опубликованы сотни методов распознавания. Они объединяются в семейства. Зачастую, эти семейства описываются в виде решающих функций (либо правил) с неопределёнными параметрами. Устоявшейся общепризнанной классификации семейств алгоритмов распознавания не существует. Поэтому ограничимся кратким описанием нескольких семейств алгоритмов, показавших свою эффективность при решении прикладных геологических задач, особенно в геологии нефти и газа.

Для подробного ознакомления с применением методов распознавания в геологии нефти и газа отсылаем читателя к публикациям 60-80 годов прошлого века, когда их использование при решения задач прогнозно-поискового профиля было массовым. Методы распознавания применялись, в частности, при решении задач прогноза гигантских нефтяных месторождений, продуктивности локальных поднятий, фазового состояния УВ в залежах и др. (Распознавание образов…, 1971; Раздельное прогнозирование…, 1978, Прогноз месторождений …, 1981 и др.).

4.3.1. Байесовские решающие правила

Эти решающие правила подробно охарактеризованы в учебном пособии Дёмина (2005), куда мы и отсылаем читателя. Для более глубокого ознакомления с приложениями байесовской теории принятия решений в геологии нефти и газа рекомендуем обратиться к монографии (Прогноз месторождений…, 1981).

4.3.2. Комбинаторно-логические методы в распознавании

Применение этих методов рассмотрим на примере одной конкретной схемы распознавания, основанной на аппарате дискретной математики и математической логики.

Пусть сначала для простоты изложения все признаки X1,…,Xn – бинарные. Согласно Журавлёву (1978) назовём произвольную совокупность  наборов признаков вида =(Xj(1),…,Xj(k)), где k=1,…,n, системой опорных множеств, ={1, 2,…, N}, а её элементы r – опорными множествами.

Пусть , =(Xj(1),…,Xj(L)), Sk – строка таблицы , Qp – строка таблицы . Строки Sk и Qp различаются по набору признаков , если найдётся входящий в  признак Xj(r) такой, что Xj(r)(Sk)Xj(r)(Qp). В противном случае будем говорить, что они не различаются.

Определение 1. Набор признаков  голосует за отнесение строки S к первому классу, если в таблице T1 найдётся строка Sk, такая, что по набору  строки S и Sk не различаются;  голосует за отнесение строки S ко второму классу, если в таблице T2 найдётся строка Qp, такая, что по набору  строки S и Qp не различаются.

Пусть Г1(S), Г2(S) – числа голосов по всем  за отнесение строки S к первому и второму классам соответственно. Тогда решающее правило имеет вид:

при Г1(S) > Qp) и Г2(S) ≤ Г2(Si) объект S относится к классу K1;

при Г2(S) > Si) и Г1(S) ≤ Г1(Qp) объект S относится к классу K2;

в остальных случаях S не распознаётся.

Смысл этого решающего правила заключается в том, что для отнесения пробы S к классу Kj, где j=1,2, она должна получить

– больше голосов за класс Kj, чем любой объект противоположного класса;

– не больше голосов за противоположный класс, чем самый близкий к этому классу объект обучения класса Kj.

Близость здесь оценивается числом голосов за класс.

Эта схема представляет собой один из простейших вариантов голосования по системе опорных множеств. Алгоритм представляет собой реализацию так называемого «принципа частичной прецедентности» (Журавлёв, 1978), при котором заключение о принадлежности объекта к классу выносится на основе анализа совпадений фрагментов его описания с соответствующими фрагментами описаний объектов этого класса. Совпадение фрагментов описаний объекта обучения и пробы является частичным прецедентом.

Пример системы опорных множеств: тестовая конструкция. Её основой являются понятия теста и тупикового теста, предложенные С.В. Яблонским в качестве математического аппарата диагностики технических устройств (Журавлёв, 1978).

Определение 2. Набор столбцов  называется тестом для пары таблиц T1, T2 если по нему нет совпадений между строками Si и Qp, где

Определение 3. Тест называется тупиковым, если из него нельзя удалить ни одного столбца без того, чтобы он перестал быть тестом.

Дмитриев, Журавлёв, Кренделев (1966) воспользовались аппаратом тупиковых тестов для создания алгоритмов классификации предметов и явлений.

В геологии нефти и газа комбинаторно-логические методы впервые были применены при решении задач прогноза гигантских нефтяных месторождений (Распознавание образов …, 1971), где была использована тестовая конструкция. Под руководством А.А. Трофимука тестовый подход применён также и к решению других важнейших прогнозных задач геологии нефти и газа (Раздельное прогнозирование…, 1978 и др.). Ряд сделанных А.А. Трофимуком прогнозов, не нашедших поддержки в момент опубликования, в дальнейшем блестяще подтвердились.

Константиновым, Королёвой, Кудрявцевым (1976) на представительном фактическом материале по прогнозу рудоносности была подтверждена эффективность алгоритмов тестового подхода по сравнению с другими алгоритмами распознавания, применявшимися для решения задач рудопрогноза.

В геологии нефти и газа другие системы опорных множеств не применялись.

Если в таблицах встречаются признаки, замеренные в количественных шкалах, то для них используются пороговые меры различимости значений (см. Красавчиков, 2009).