
3.Области применения ипт
3.1. Области применения ипт в информационной технологии
Среди областей применения ИПТ в информационной технологии как в «доинтернетовскую» эпоху, так и в настоящее время, можно выделить следующие:
- терминологический контроль и нормализация лексики конкретной отрасли знания, обеспечение единого и формализованного представления информации в ИПС;
- явное выражение парадигматических отношений, существующих между лексическими единицами какой-либо отрасли науки или техники;
- автоматизированное индексирование документов и запросов;
- повышение полноты и точности информационного поиска в полнотекстовых БД на естественном языке;
- уточнение информационных запросов, составление и оптимизация поисковых предписаний в Интернете и др. сетях;
-реферирование и аннотирование текстов;
- редактирование текстов;
- анализ терминологического состава той или иной отрасли знания;
- установление гипертекстовых связей между похожими документами или фрагментами документов, что дает возможность пользователю, найдя один релевантный документ, запросить похожие на него документы;
- автоматическое выделение из текстов документов наиболее содержательных фрагментов, обеспечивающее пользователю возможность быстро просматривать массивы документов больших объемов.
3.2. Ипт как лингвистическое средство для решения прикладных задач в различных областях знания и деятельности
ИПТ широко используются для решения прикладных задач целом ряде областей знания и практической деятельности. Дадим краткую характеристику лишь некоторых из этих областей применения.
Журналистика, издательское дело, образование. Среди средств проверки правописания, которыми предоставляют пользователю современные персональные компьютеры, широко известны «тезаурусы» – простейшие средства синтаксической проверки текстов. Причем тезаурусы обычно сведены к словарям синонимов. Однако многим пользователям, особенно людям, профессионально занятым подготовкой текстов (журналистам, редакторам, издательским работникам и др.) требуются сведения не только о синонимах. Часто пользователю требуется узнать: как еще можно передать этот смысл другими словами? Какие слова могут сочетаться, а какие – нет?
В институте русского языка АН России предложена идея тезауруса с расширенным набором функций для системы подготовки текстов (4). Информационные услуги, предоставляемые тезаурусом:
Подобрать синоним ( «мозговой штурм- брейншторминг»).
Найти или проверить антоним («импорт-экспорт»)
Найти гипероним – слово с более широким значением, выражающее общее, родовое понятие, название класса (множества) предметов (свойств, признаков). Например, слово «дерево» является гиперонимом по отношению к словам «дуб, ясень, береза».
Найти гипонимы – слова, выражающие видовые, нижестоящие понятия. Например, слово «бульдог» - гипоним по отношению к слову «собака».
Найти холоним, то есть слово, обозначающее объект, который включает в себя другое. Например, у лестницы есть ступеньки. «Лестница» – холоним для слова «ступенька» Холонимы отражают отношение «множество – часть множества»: «волк- стая волков», «корова- стадо коров», но «лев – семейство, полчища, прайд».
Найти мероним – слово, обозначающие объект, являющийся частью для другого Например, слово «монитор» – это мероним для слова «компьютер».
Найти типовые определения для данного существительного, глагола, прилагательного или наречия, то есть любые устойчиво сочетающиеся слова. Например:
Ключевое слово |
Не верно |
Верно |
Кругозор |
Ширина |
Широта |
Тишина |
Продолжается |
Стоит, царит |
Слушатель |
Благодатный |
Благодарный |
Пример |
Большой |
Развернутый |
Активность |
Применить |
Проявить, выказать |
Найти типовые определяемые слова для данного определения в виде прилагательного, наречия или словосочетания.
Всего планируется предусмотреть в тезаурусе 16 функций.
Назначение такого тезауруса заключается в следующем:
1. В русскоязычной среде:
1.1. для деловых людей, которые составляют контракты, отчеты, письма и желают строго выдерживать деловой стиль;
1.2. для научно-технических специалистов, которые компонуют, создают или редактируют отчеты, статьи, пособия или книги и желают избежать «суконного» технического языка;
1.3. для начинающих журналистов, желающих освоить богатство русского языка в своих публикациях и проверить нормативность собственного языка и языка своих коллег;
1.4. для учащихся и студентов, особенно если русский язык для них не является родным.
2. В иноязычной среде:
2.1. для студентов университетов с русским или славянским отделением;
2.2. для профессиональных переводчиков и учителей русского языка;
2.3. для деловых людей в «ближнем зарубежье», желающих сохранить достаточно высокий уровень грамотности своей русскоязычной переписки.
Психология и психодиагностика. В МГУ им. М.В.Ломоносова для использования в психодиагностике разработан «Тезаурус личностных черт» (12). Тезаурус содержит 350 словарных статей, построенных по принципу сходства и контраста для 350.Слова расположены не в алфавитном порядке, а в порядке семантической близости. Под каждым ключевым словом приведены вначале 12 самых близких, а после трех звездочек – 12 контрастных слов. Например:
ОБЩИТЕЛЬНЫЙ
Жизнерадостный |
Экстравертированный |
Живой |
Разговорчивый |
Компанейский |
Балагур |
Затейник |
Коммуникабельный |
Сангвиник |
Темпераментный |
Весельчак |
Неунывающий |
***
Пессимист |
Задавленный |
Понурый |
Нелюдимый |
Безучастный |
Молчаливый |
Необщительный |
Пассивный |
Вялый |
Инертный |
Апатичный |
Безразличный |
Области применения тезауруса личностных черт:
в деятельности психологов, педагогов – для создания психологических портретов не только отдельных профессий, но и социально-типических форм поведения (обобщенный портрет бюрократа, кинозвезды, энтузиаста и т.п.);
в деятельности кадровых служб – для подготовки характеристик сотрудников.
Терминоведение и описание систем знаний. Политематические, отраслевые и проблемные тезаурусы могут быть использованы следующим образом (5-6):
- как средство описания – инвентаризации существующего уровня знаний в той или отрасли наук, поскольку каждый термин представляет собой «сгусток знаний», ибо может быть развернут в определение (дефиницию);
- как средство систематизации терминологии, а следовательно, и знаний в определенной отрасли науки. Это обусловлено тем, что первым элементом большинства научных дефиниций терминов является указание на непосредственно вышестоящее понятие. Следовательно, и в тезаурусе, где система понятий эксплицитна, т.е. явно выражена, иерархия понятий всегда представлена наглядно;
- как средство стимулирования развития знаний. Тезаурусное представление терминологии, кроме установления единообразного понимания основных понятий, позволяет выявить пробелы (пропуски, лакуны), малоизученные понятия и «точки сгущения» в терминологических и понятийных системах. Это может служить ориентиром в последующих исследованиях, позволяет выявить аналогии подсистем понятий, а также определить тенденции выделения подсистем понятий и рубежи знаний, от которых возможно дальнейшее развитие данной области;
- как средство описания истории развития специальных знаний в определенной предметной области. Тезаурусное представление терминологии позволяет проводить исследования особенностей развития отраслевых знаний, включая количественное исследование вклада отдельных ученых и научных школ в развитие общей теории с учетом как количества, так и новизны (в зависимости от статуса вводимого термина – основной термин или синоним уже существующего наименования понятия) и иерархического статуса понятий, вводимых соответствующим термином.
Завершая рассмотрении эволюции и областей применения ИПТ, следует отметить, что, несмотря на временное снижение интереса разработчиков АИС к ИПТ, в настоящее время, с появлением полнотекстовых баз данных на естественном языке и, в особенности, с развитием сети Интернет, появилась тенденция к новому осмыслению логико-семантической функции тезаурусов в современных АИС, расширению областей применения ИПТ. Опыт показал, что необходим «возврат» к идее использования ИПЯ с контролируемой лексикой, в т.ч. ИПТ, для обеспечения поиска информации, прежде всего, в контролируемой части Интернета – в электронных библиотеках.