
- •Институт вычислительного моделирования
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов 21
- •Глава 2. Принцип объектных определений как основа классификации единиц языка 53
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов 86
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов 114
- •Введение
- •Глава 1. Исследование задач формализации семантики языковых единиц в применении к созданию естественно-языковых интерфейсов
- •1.1. Проблема применения лингвистического аппарата в естественно-языковых интерфейсах программных систем
- •1.1.1. Проблема исследования значения
- •1.1.2. Язык и речь, грамматика и семантика, другие предметы лингвистической науки и их применение в информатике
- •1.2. Семантические классификации языковых единиц в лингвистических базах данных
- •1.2.1. История составления словарей
- •1.2.2. Семантические поля, тезаурусы, темы и подтемы
- •1.2.3. Задача представления иерархии языковых единиц
- •1.3. Лингвистические исследования множества слов в речи
- •1.3.1. Тождественные элементы значения слов в тексте
- •1.3.2. Сильные и слабые импликации в тексте
- •1.3.3. Порождающие грамматики
- •1.4. Представление слов языка и проблема полисемии
- •1.4.1. Внутренняя структура слова, ядро и периферия
- •1.4.2. Дефинитивное и полное значение слова
- •1.4.3. Применение компонентного анализа
- •1.4.4. Лексико-семантические варианты в языке и речи
- •1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода
- •1.5.1. Системы типа «Интерлингво» и машинный перевод
- •1.5.2. Проблемы создания языка описания семантики
- •1.6. Табличный естественно-языковой интерфейс
- •1.7. Задачи диссертационной работы
- •Выводы к главе 1
- •Глава 2. Принцип объектных определений как основа классификации единиц языка
- •2.1. Формализация дефиниций
- •2.1.1. Общий вид формальной дефиниции
- •2.1.2. Последовательность классификаций единиц языка
- •2.1.3. Определение базиса понятийного аппарата словарных дефиниций
- •2.1.4. Представление языка
- •2.2. Принципы построения классификации
- •2.2.1. Множество классификаций
- •2.2.2. Множество отрицаний в определении классификации единиц языка
- •Семантика и семантическая классификация
- •2.3.1. Семантический и другие аспекты языка
- •2.3.2. Проблема построения классификаций вида Ai.Cj
- •2.3.3. Семы классификации
- •2.3.4. Геносемы
- •2.3.5. Классификация понятий
- •2.3.6. Синтагмы и валентности
- •2.3.7. Факты классификации
- •2.3.8. Высказывания
- •2.4. Понятийное пространство в целом
- •Выводы к главе 2
- •Глава 3. Словарь порождения языковых единиц как средство формирования «табличных» интерфейсов
- •3.1. Общие принципы построения словаря
- •3.1.1. Понятийное пространство и его наполнение
- •3.1.2. Классификация p1.D3 в целом
- •3.2. Уровни классификации
- •3.2.1. Вектор классификации слов и понятий
- •3.2.2. Валентностный уровень классификации
- •3.2.3. Уровень основных сем
- •3.2.4. Уровень локализации
- •3.2.5. Уровень свойств
- •3.2.6. Уровень отношений
- •3.2.7. Рекурсивное порождение последующих уровней классификации
- •3.3. Примеры понятий и их кодовых обозначений
- •3.3.1. Примеры понятий для уровня основных сем
- •3.3.2. Примеры понятий для валентностного уровня классификации
- •3.3.3. Примеры понятий уровня локализации
- •Семантический код описания смысла
- •3.4.1. Кодировка сочетаний групп слов
- •3.4.2. Кодировка стилистики языка
- •3.4.3. Формула слова и плановые языки
- •3.5. Типы классификаций
- •3.5.1. Словарь гиперонимов
- •3.5.2. Тематический словарь
- •3.5.3. Словарь дефинонимов
- •Выводы к главе 3
- •Глава 4. Программное обеспечение естественно-языковых интерфейсов
- •4.1. Системы «Электронный словарь» и «Электронный разговорник»
- •4.2. Назначение системы «Электронный словарь»
- •4.3. Функции системы «Электронный словарь»
- •4.4. Состав и структура системы «Электронный словарь»
- •4.5. Входные и выходные данные
- •4.6. Функционирование системы «Электронный словарь»
- •4.7. Программная система «Электронный разговорник»
- •4.7.1. Назначение программы «Электронный разговорник»
- •4.7.2. Функции программы «Электронный разговорник»
- •4.7.3. Структура программы «Электронный Разговорник»
- •4.7.4 Входные и выходные данные программы «Электронный разговорник»
- •4.7.5. Описание работы программы «Электронный разговорник»
- •Выводы к главе 4
- •Заключение
- •Литература
- •Приложение 1. Определения основных терминов
- •Приложение 2. Фрагмент словаря подстановочных таблиц
4.2. Назначение системы «Электронный словарь»
На основе изложенных выше теоретических принципов разработана электронная версия словаря-классификации слов английского и русского языка, позволяющая составлять подстановочные таблицы. Это единственный на сегодня словарь подстановочных таблиц. Разработка системы имело целью решение двух основных практических задач:
-
Унификация базы данных, в частности, по правилам, структурам и вокабуляру (словарному запасу) английского языка и автоматическая генерация учебников по иностранному языку для конкретной группы населения.
-
Генерация в самое короткое время индивидуальных учебных пособий для отдельных учащихся с учетом их конкретных пробелов в знаниях, потребностях в тех или иных группах слов, работе над теми или иными аспектами языка: разделами фонетики, грамматики, навыками письма, чтения, говорения и аудирования (восприятия речи на слух).
Подобная унификация и классификация учебного материала, очевидно, должна повысить эффективность обучения иностранному языку.
Предполагается, что для представления материалов в унифицированном виде необходимо использовать принцип понятийного пространства, то есть схожая по смыслу информация должна находиться в структурах данных, «расположенных» близко друг к другу. На этом принципе основаны следующие разделы Электронного словаря:
-
Словарь-классификация слов английского и русского языков.
-
Тематический словарь ссылок на словарь-классификацию.
-
Древесная классификация грамматических, фонетических и прочих теоретических материалов, описывающих правила английского языка.
-
Алфавитный словарь в виде поисковой системы слов и его синонимов, антонимов и оппозиций.
Данный словарь содержит также ряд других разделов, функции которых описаны далее. В основу словаря положена методика «Открой и говори», позволяющая ученику говорить на английском языке в рамках некоторой темы-ситуации при помощи подстановочных таблиц, генерируемых в словаре. Основу словаря составляет наиболее употребительная лексика на бытовые и общепрофессиональные темы, научная лексика. Он также содержит специальные темы из ряда областей: компьютеры, дизайн, музыка, биология, парикмахерское искусство, математика и др.
Наличие гибкой системы подбора лексики и подстановочных таблиц позволяет, добавив в словарь от нескольких десятков до нескольких сотен слов по какой-либо дополнительной тематике, иметь возможность подбора материалов к урокам английского языка в рамках более чем 1000 единиц универсальной лексики и вновь добавленных слов. По нашим данным на сегодняшний день не получила сколько-нибудь широкого распространения ни одна программа, позволяющая профессиональному преподавателю гибко и оперативно подбирать материалы к урокам английского языка. Все существующие электронные учебники ориентированны, в первую очередь, на изучение материалов непосредственно учеником, некоторые из них позволяют распечатывать рисунки или иную информацию в ограниченном объеме и без должной гибкости в подборе учебных материалов. Программа «Электронный словарь» позволяет использовать авторский метод «Открой и говори» в работе с учениками. Этот метод дает возможность говорить на незнакомом языке без знания слов и правил на основе подстановочных таблиц, генерируемых при помощи электронного словаря.
Отличительными особенностями словаря являются следующие характеристики. Словарь составлен на основе принципов, описанных в главах 2-3, место каждого слова в словаре раскрывает его внутреннюю семантическую структуру. Словарь использует существующие частотные методики в подборе лексики (лексиколизации).
Деление слов в словаре по группам имеет следующие преимущества. Заучивание слов в логических группах более эффективно, чем заучивание слов вразброс или даже просто по темам. Кроме того, если пользователь ощутил нехватку известных ему слов в какой-либо области, он может направленно выбрать из классификации нужные ему группы слов и компенсировать пробел в этой области. Использование словаря способствует развитию «комплексного мышления»: ученик учится оперировать не отдельными словами, а целыми классами слов в речи. В словаре проведено сопоставление слов в синонимических, антонимических и оппозиционных группах, например, «лежать на – сидеть на – стоять на; ползти по – шагать по». Словарь поддерживает функции нахождения слов по семантическому признаку, используя родовидовые отношения на каждом уровне классификации
Пользователь программы может использовать как алфавитный, так и семантический, как англо-русский, так и русско-английский словарь (а также транскрипционно-английский и транскрипционно-русский словари).
Поиск отдельного нужного слова в словаре может проходить по следующим критериям:
-
по форме слова английского языка
-
по форме слова русского языка
-
по произношению слова в английском языке
Пользователь может ограничить словарь наиболее употребительными словами языка. Темы в словаре разбиты на повседневные (для начала обучения) и специальные (для специалистов или профессионалов).
-
уровень starter
-
уровень beginner
-
уровень intermediate
-
уровень advanced
-
уровень professional
В словаре предусмотрен также уровень minus intermediate, в котором отброшены наиболее простые и известные слова английского языка.
Электронный словарь представляет собой набор программ, целью которых является изучение и использование английского языка русскоязычным пользователем. Он также является средством составления преподавателем эксклюзивных материалов для каждого отдельно взятого ученика. Он предназначен также для подбора материалов к урокам английского языка, а также словарей, учебников и разговорников по обучению иностранным языкам в целом. Словарь представляет средство подбора и копирования различных методических материалов для уроков английского языка не только преподавателем, но и конкретными пользователями.
Пользователь имеет возможность ознакомиться с классификацией слов английского языка. В основе этой классификации лежит иерархия понятий, более общие понятия находятся на вершине, более частные на более низких узлах. При составлении классификации была учтена возможность добавления любых понятий внутрь классификации, без расширения ее вовне. Принципы построения этой классификации подробно изложены в 1-3 главах. Реализация принципов классификации слов и понятий языка в системе «Электронный словарь» выражается в построении классификации слов языка на основе фиксированного вектора признаков.
Данный словарь содержит более чем 10000 слов и конструкций английского языка. Применение подстановочных таблиц при подборе лексики резко повышает количество запоминаемых учениками слов за урок. Пример такой подстановочной таблицы приводится ниже:
Таблица 4.1
Пример подстановочной таблицы из электронного словаря
|
|
THE … Зэ … этот … |
|
THE … Зэ … этот … |
|
I Ай я |
scan скАЕн просматривать |
rough_copy_of рА:ф_кОпи черновой_вариант |
book бУк книга |
||
we ВИ мы |
read рИ:д читать |
draft_of дрАфт черновик |
newspaper нйуспЕйпэ газета |
||
you йУ: вы |
write рАйт писать |
manuscript_of мАЕнйускрипт рукопись |
paper пЕйпэ газета |
||
they Зей они |
scrawl скрО:л писать_(плохо) |
typescript_of тАйпскрипт машинописная_копия |
magazine мэгэзИ:н журнал |
||
|
scribble скрИбл писать_(плохо) |
copy_of кОпи копия |
journal джЭ:нэл журнал |
||
|
print прИнт напечатать |
edition_of Едишн издание |
cutting кАтиН вырезка |
||
|
publish пАблиш опубликовать |
column_in кОлэм колонка |
letter лЕтэ письмо |
||
|
understand андэстЕнд понимать |
page_of пЕйдж страница |
post-card пОуст-кА:д почтовая_карточка |
||
|
acquaint_with экВЕинт_ВИЗ ознакомиться |
double_page_of дАбл_пЕйдж разворот |
telegram тЕлэгрэм телеграмма |
||
|
tear тИэ рвать |
volume_of Волйум том |
report рипО:т доклад |
||
|
type тАйп печатать |
chapter_of чАЕптэ глава |
announcement энАунсмэнт объявление__заявление |
||
|
correct корЕкт исправлять |
part_of пА:т часть |
advertisement эдвЭ:тисмэнт реклама |
||
|
edit Едит редактировать |
paragraph_of пАЕрэгрэф параграф__абзац |
piece_of_writing пИсэврАйтиН произведение |
||
|
|
headline_of хЕдлайн заголовок |
article А:тикл статья |
||
|
|
contents_of кОнтентс содержание |
story стОри рассказ |
||
|
|
abstract_of АЕбстраект краткий_обзор |
literature лИтричэ литература |
||
|
|
introduction_of интрэдАкшн введение |
novel нОвел роман |
||
|
|
conclusion_of конклУ:жн вывод |
poetry пОуэтри поэзия |
||
|
|
item_of Айтэм пункт |
verse вЭ:с стих |
||
|
|
article_of А:тикл пункт |
detective..story дитЕктивстОри детектив |
||
|
|
conclusion_of кэнклУ:жн вывод |
adventure..story эдвЕнчэстОри приключенческий_роман |
||
|
|
date-line_of дЕйт-лАйн выходные_данные |
fairy..tale фЕэритЕйл сказка |
||
|
|
line_in лАйн строка |
spy..thriller спАйСрИлэ книга_про_шпионов |
||
|
|
indented_line_in индЕнтид_лАйн красная_строка |
contemporary..novel контЕмпэрэринОвл современный_роман |
||
|
|
break_line_in брЕйк_лайн красная_строка |
fiction фИкшн художественное_произведение |
||
|
|
capital_letter_in кАЕпитл_лЕтэ большая_буква |
science..fiction сАйэнсфИкшн научная_фантастика |
||
|
|
argument_in А:гйумэнт аргумент |
non-fiction нонфИкшн документальное_произведение |
||
|
|
reason_from рИзн довод |
biography бАйогрэфи биография |
||
|
|
idea_of айдИэ идея |
memoir мемВА: мемуары |
||
|
|
statement_from стЕйтмэнт утверждение |
travel..book трАЕвлбУк книга_о_путешествиях |
||
|
|
main_idea_of мЕйн_айдИэ главная_мысль |
classics клАЕсикс классика |
||
|
|
theme_of СИ:м тема |
chronicle крОникл хроника |
В таблице 4.1 приводится пример подстановочной таблицы, генерируемой при помощи программы «Электронный словарь».
Для построения предложения на основе подстановочных таблиц необходимо взять по одному слову из каждой колонки, и если выше выбранного слова стоит знак типа: «the …», «I have to … a(n)» и т.п. нужно подставить выбранное слово вместо многоточия. Получаемые предложения отличаются как грамматической, так и смысловой корректностью. Электронный словарь, позволяет подбирать любые подстановочные таблицы за очень короткое время, порядка одной таблицы в минуту. Также он позволяет копировать теоретические объяснения и задания в специальном формате, доступном для программы «Комбинаторный разговорник».
В личном письме автор одних из самых известных Кембриджских курсов английского языка Michel Swan указал на достоинства метода подстановочных таблиц, который, по его словам, пока не нашел места в современных методиках обучения иностранному языку.
Данный метод используется непосредственно автором. С первых же дней ученики изучают несколько десятков новых слов в семантических группах и овладевают школьным курсом английского языка за несколько месяцев.
Метод используется также другими преподавателями из различных школ и вузов города Красноярска.