Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Компьютерная технология понимания геологических текстов.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
52.77 Кб
Скачать

Компьютерная технология понимания геологических текстов

Год: 

2005

Автор научной работы: 

Дудецкий, Владимир Николаевич

Ученая cтепень: 

доктор технических наук

Место защиты диссертации: 

Москва

Код cпециальности ВАК: 

25.00.35

Специальность: 

Геоинформатика

Количество cтраниц: 

230

Оглавление диссертации доктор технических наук Дудецкий, Владимир Николаевич

Глава 1. Основы геологической терминологики.

1.1. Роль и значение геологической терминологики в развитии геологической науки.

1.2. Предмет геологической терминологики.

1.3. Средства геологической терминологики.

Глава 2. Основные проблемы понимания компьютером текста на естественном языке и методы их решения.

2.1. Роль и значение понимания текста на естественном языке для решения задач человекомашинного общения

2.2. Анализ состояния проблемы компьютерного понимания текста на естественном языке.

2.3. Основные цели и задачи совершенствования механизма понимания текста компьютером.

Глава 3. Методологические основы регулирования взаимодействий процессов в системе понимания текста.

3.1. Механизм преобразования текста во внутренние образы.

3.2. Регулирование процессов формирования базы знаний.

3.3. Развитие компьютерной системы знаний.

3.4. Совершенствование элементов механизма понимания текста на естественном языке.

3.4.1. Совершенствование методов построения базы знаний

3.4.2. Развитие стратегий анализа текста в системах человекомашинного общения.

3.4.3. Методы оптимизации системы понимания текста на естественном языке

3.4.3.1. Задачи повышения качества функционирования систем человекомашинного общения.

3.4.3.2. Улучшение объемно-временных характеристик систем человекомашинного общения.

3.4.3.3. Обеспечение целостности и надежности данных в системах человекомашинного общения.

Глава 4. Апробация технологии анализа геологических текстов. Введение диссертации (часть автореферата) На тему "Компьютерная технология понимания геологических текстов"

Актуальность темы.

Развитие вычислительной техники позволяет решать все более сложные задачи в производстве, науке и социальной сфере. Объединенные общим термином трудноформализуемые, задачи эти представляют собой предмет непрекращающихся попыток их решения на протяжении последних пятидесяти лет. Среди множества трудноформализуемых задач большое внимание уделялось и уделяется решению задач человекомашинного общения на естественном языке. К ним относится задача построения терминологических систем по отдельным областям научного знания.

Если терминологией называется стихийно сложившаяся совокупность терминов, то терминологическая система представляет собой упорядоченную терминологию. В отличие от терминологической системы, терминология, как правило, не отличается полнотой и имеет нечеткое соотношение между системами понятий и терминов, т. е. не каждому понятию соответствует определенный термин, и наоборот, один и тот же термин может соответствовать разным понятиям. Поэтому при построении терминологической системы для какого-либо терминологического поля необходимо выполнение следующих операций: выявление исходных неопределяемых понятий данного терминологического поля; выявление сложных производных понятий; проверка системы понятий на полноту и построение классификационной схемы; проверка имеющихся определений понятий на непротиворечивость и уточнение их в соответствии с классификационной схемой; построение полной терминологической системы; разработка формального представления для использования в автоматизированных фактографических системах [105, 106].

Перечисленные операции требуют выполнение рутинной работы в огромных объемах. Поэтому до сих пор работы в основном проводились в двух разных направлениях: сбор терминологии и создание терминологических справочников и разработка дескрипторных словарей. Сбор терминологии пока ограничивался «инвентаризацией». Не проводились работы по определению полноты терминологии и построению терминологических систем и по установлению взаимно однозначного соответствия между системой понятий и системой терминологии. Для ускорения процесса создания терминологических систем необходимо решить задачу автоматизации процесса их построения.

Эта задача особенно актуальна при создании геологических терминологических систем, так как геологический язык обладает многозначностью не только лексического, но и синтаксического и стилевого плана. Многозначность геологического языка — это не его недостаток, а неизбежное следствие принадлежности к естественному языку. Специфика лексики геологического языка обусловлена тем, что основную семантическую нагрузку в ней выполняют термины и слова общелитературного или общенаучного языка, но употребляемые в терминологическом значении.

Перечисленные проблемы обуславливают необходимость и актуальность разработки теоретических и практических основ дальнейшего совершенствования системы понимания текста на естественном языке.

В диссертации приводится обобщение результатов исследований автора, опубликованных в научных работах, отражающих его вклад в процесс совершенствования методологии понимания компьютером текста на естественном языке и методики организации базы знаний системы.

Цель исследования: разработка методов, алгоритмов и комплекса программ понимания геологических текстов, обусловленная необходимостью построения терминологических геологических систем.

Для достижения поставленной цели необходимо решить следующие задачи: провести оценку современного состояния компьютерного понимания текста на естественном языке и определить методы его совершенствования для обеспечения эффективности построения терминологических систем в геологии; выбрать критерий качества понимания текста компьютером, позволяющий определить требования к структуре базы знаний, моделям, алгоритмам и программному обеспечению системы понимания текста; разработать базу знаний системы и выполнить программирование разработанных моделей и алгоритмов, обеспечивающих требуемый уровень качества понимания текстов; провести апробацию технологии анализа геологических текстов, которая позволит оценить уровень качества понимания текста системой.

Предметом исследования является геологическая терминология и геологические тексты, представляющие разные направления геологической науки.

Объектом исследования являются методы и алгоритмы понимания компьютером текста на естественном языке.

Общетеоретическую и методологическую базу исследований составляют труды отечественных и зарубежных ученых в области интеллектуальных систем, прикладной лингвистики, инженерной психологии, информационного анализа, геологии.

Методика исследования.

Разнообразие и сложность предметной области анализа обусловили необходимость использования системного и программно-целевого подхода, расчетно-аналитических методов, создание методологической и методической основы для формирования механизма понимания текста на естественном языке и апробацию разработанных положений в отдельных научных организациях.

Научная новизна работы заключается в следующем: разработана методика автоматизации процесса создания терминологических систем в геологии, основанная на компьютерной технологии понимания текста на естественном языке; разработана современная методология понимания текста, основанная на компьютерном моделировании и автоматизирующая процесс построения геологических терминологических систем; разработана система понимания текста на естественном языке, построенная на основе оригинальной распределенной неоднородной саморазвивающейся базы знаний; проведен анализ геологических, геофизических, геохимических и геоинформационных текстов на предмет особенностей их лексической, синтаксической, семантической и логической структуры, а также анализ геологической терминологии.

Защищаемые положения: методология понимания компьютером текста позволяет автоматизировать процесс построения геологических терминологических систем разных направлений геологического знания; методика автоматизации построения геологических терминологических систем, основанная на компьютерной технологии понимания текста, позволяет повысить эффективность создания этих систем; качество машинного понимания текстов на естественном языке есть монотонно возрастающая функция количества прочитанных системой текстов и времени ее функционирования; анализ геологических текстов, проведенный с помощью системы понимания текста на естественном языке, показал способность системы к построению терминологических систем в такой трудноформализуемой области естественного языка как геологический язык.

Практическая значимость полученных результатов.

Результаты исследования имеют практическое значение для процесса понимания компьютером текста на естественном языке. Использование предложенных в работе методологических основ, методических рекомендаций, аналитических разработок и разработанной на основании их системы понимания текста на естественном языке способствует совершенствованию научной обоснованности и эффективности решений, принимаемых при проектировании человекомашинного общения в различных приложениях.

Апробация результатов диссертационного исследования.

Основные положения, выводы и рекомендации диссертации были доложены на II и III Международных конференциях «Новые идеи в науках о Земле». Методологические и методические предложения легли в основу разработанной автором системы понимания текста на естественном языке, внедрение которой в учебный процесс позволяет проводить занятия со студентами на качественно новом уровне.

Ряд положений диссертационной работы нашел отражение в монографии:

Система понимания текста на естественном языке. М.: РИО МГГА, 2001,107с.

Публикации. Основное содержание диссертации опубликовано и содержится в 33 работах общим объемом 19,3 п.л., в том числе выполненных лично автором 16,2 п.л., включающих 1 монографию и 32 статьи в сборниках и журналах.

Объем работы.

Диссертация состоит из введения, 4 глав, заключения, списка литературы.