- •Введение
- •2. Типовые задачи анализа данных
- •3. Элементы прикладной статистики в анализе данных
- •4. Распознавание образов
- •4.1 Основные подзадачи
- •4.2. Сведение задачи уточнения границы геологического тела к решению задачи распознавания образов
- •4.3. Примеры алгоритмов распознавания
- •4.3.1. Байесовские решающие правила
- •4.3.2. Комбинаторно-логические методы в распознавании
- •4.3.1. Линейные методы
- •5. Упорядочение
- •6. Кластер-анализ
- •6.1. Иерархические алгоритмы
- •6.1.1. Агломеративные алгоритмы
- •6.1.2. Дивизимные алгоритмы
- •6.2. Алгоритмы, порождающие разбиения
- •7. Заполнение пропусков в таблицах
- •8. Моз (машинное обнаружение закономерностей)
- •9. Нахождение покрытий и градиентный алгоритм приближённого решения этой задачи
- •10. Учебно-методические рекомендации, контрольные вопросы, комментарии
- •Раздел 2
- •Раздел 3
- •Раздел 4
- •Раздел 5
- •Раздел 6
- •Раздел 7
- •Раздел 8
- •Раздел 9
Раздел 7
Предложите способы заполнения одиночного пропуска сведением к решению задач (а-в) с учётом шкалы, в которой замерен признак с пропуском, без потери исходной информации.
Раздел 8
1. Объясните, почему стохастические константы можно рассматривать как частный случай решающих правил распознавания.
2. Следует учесть, что по коэффициенту Спирмена связь между двумя количественными признаками X и Y может оказаться недостоверной, будучи, с содержательных позиций, вполне очевидной. Это может быть связано с малым объёмом выборки, наличием грубых единичных ошибок и т.д. При этом программный продукт Statistica for Windows будет давать достоверную связь при вычислении коэффициента Пирсона. Однако, если не выполнены жёсткие вероятностно-статистические предположения о совместном распределении двух признаков (см. раздел 3), опираться в геологическом анализе на установленную достоверность связи по Пирсону некорректно.
Раздел 9
Приведем пример решения задачи о покрытии градиентным методом. Пусть покрываемое множество V состоит из 10 элементов v1,…,v10, а покрывающее множество Е – из девяти: e1,…,e9, где
e1={1,4,6,8,9,10},
e2={3,5,7,8},
e3={2,4,6,8,9},
e4={2,3,5,7},
e5={1,7,8},
e6={2,3,9},
e7={4,6,8,9,10},
e8={3,4,6,8,9},
e9={5,6,7,8,9}.
Отношение инцидентности I зададим следующим образом: viIej если и только если i ej.
Первый шаг градиентного алгоритма заключается в выборе e1 как инцидентного максимальному числу элементов множества V. После этого шага остались не покрытыми v2, v3, v5, v7,. Все они инцидентны элементу e4. Таким образом множество C={e1, e4} – покрытие. Покрытий, состоящих из одного элемента, как легко видеть, нет. Поэтому С – минимальное покрытие.