Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Истомин А.В. Анализ_данных.doc
Скачиваний:
2
Добавлен:
08.12.2018
Размер:
307.71 Кб
Скачать

Раздел 6

1.Пусть Al={(0,1), (2,0), (2,3)}, Aq={(5,1), (6,2), (8,3), (9,5), (10,7)}. Рассчитайте расстояния (а –ж).

2. Полагая S= Al Aq решите задачу кластеризации совокупности объектов S методом Чоудари

3. На локальном уровне для отдельной площади или скопления площадей («малой» зоны) кластер-анализ успешно применяется при корреляции дизъюнктивных нарушений по данным 3D-сейсморазведки (Кашик и др, 2004).

Опыт применения кластер-анализа на региональном и зональном уровне показал, что эти методы могут давать полезную информацию об истории развития изучаемых толщ и тектонических процессах, типах геологических разрезов, их раcпространении по латерали, зонах развития коллекторов в них, нефтегазоносности. Однако для этого, как выяснилось, нужны достаточно «густые» регулярные сетки толщин отложений, поэтому главный фактор, сдерживающий его применение при региональных и зональных построениях (в случае «больших» территорий), – необходимость хранения и пересчётов матрицы расстояний для всей совокупности объектов.

Если исходить из оценки трудоёмкости вычислений, то на локальном уровне, за исключением обработки данных 3D-cейсморазведки, вполне можно использовать практически любые алгоритмы кластер-анализа. При региональных и зональных построениях с использованием сеточных моделей (в случае «больших» территорий), а также при обработке данных 3D-сейсморазведки (даже на уровне отдельной площади или «малой зоны»), целесообразно выбирать алгоритм, не требующий пересчёта матрицы расстояний, например, метод Чоудари.

4. Наметим, в общих чертах, подход, позволяющий эффективно использовать кластер-анализ данных бурения при прогнозных построениях. Пусть, например, анализируются данные по какому-либо региональному или зональному резервуару УВ. На основании некоторого исходного списка признаков (не включающего результаты испытаний скважин и их координаты) производится кластеризация объектов.

Затем для каждого кластера анализируются пространственное размещение скважин и результаты их испытаний. У найденных кластеров вычисляются такие простые, но весьма информативные параметры как частость получения притока среди всех испытаний скважин, доля скважин, давших приток УВ среди скважин, давших приток пластового флюида и другие показатели, характеризующие распространенность коллекторов в проницаемом комплексе резервуара и его нефтегазоносность.

В принципе, реализация этой схемы может давать полезную информацию и при локальных построениях. На любом уровне прогноза – от регионального до локального – следует, в первую очередь, понять, с какими геологическими ситуациями, какими особенностями геологического строения связаны «интересные» с точки зрения наличия коллекторов и нефтегазоносности кластеры. «Интересные» кластеры подвергаются более детальному изучению, при котором может быть поставлена и (при наличии соответствующей дополнительной информации) решена задача пространственного распределения того или иного кластера путем решения задачи распознавания принадлежности уже не скважин, а узлов равномерной сетки к этому кластеру. Естественно, что список исходных характеристических признаков может при этом существенно измениться.

6. Замечательной особенностью метода Чаудари, на наш взгляд, является то, что при заданном максимальном числе разбиений он позволяет без искажения результата «загрубить» исходные данные и, вследствие этого, существенно уменьшить объем обрабатываемой выборки за счет удаления повторяющихся объектов.

Однако, применительно к региональным и зональным построениям, и он уязвим с точки зрения возникновения большого числа несущественных кластеров, образуемых «аномальными», «уникальными», «переходными» и т.п. объектами.

Кроме того, результаты кластеризации существенно зависят от выбранных пользователем минимальных и максимальных значений признаков. Это могут быть как выборочные минимумы и максимумы, так и значения, меньшие выборочного минимума и большие максимума. Выбор таких значений может быть обусловлен какими-либо теоретическими или практическими соображениями.