Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекс практикум студенты.docx
Скачиваний:
46
Добавлен:
06.02.2015
Размер:
73.95 Кб
Скачать

Электронные лексикографические ресурсы: общая характеристика и внедренность в переводческий процесс

Профессиональная деятельность переводчика сегодня немыслима без использования информационных технологий. Современные наработки в области автоматизации переводческой деятельности обеспечивают высокую продуктивность и качество работы переводчика.

Все средства автоматизации процесса перевода в той или иной степени связаны с компьютером и относятся либо к аппаратным, либо к программным средствам. Оставляя за рамками изучения «железо» компьютера, рассмотрим более подробно программные средства – минимальный набор инструментов и ресурсов, который необходимо или желательно иметь на своем рабочем компьютере переводчику.

  1. Электронный словарь

Электронный словарь (computer dictionary) – это компьютерная база данных, содержащая особым образом закодированные словарные статьи, позволяющие осуществлять быстрый поиск нужных слов, часто с учетом морфологических форм и с возможностью поиска сочетаний слов (примеров употребления), а также изменения направления перевода (http://ru.wikipedia.org).

Таким образом, электронные словари обладают весомыми преимуществами над бумажными словарями, обеспечивая

  • Высокую скорость обработки информации

  • Возможность оперативного импортирования эквивалента в текст перевода

  • Портативность носителей информации

  • Наличие новейшей и специальной лексики

  • Оперативное пополнение новыми словами

  • Возможность включения пользовательских словарей, их дальнейшее расширение и совершенствование

  • Формирование истории запросов

  • Возможность переключения направления перевода

  • Дополнительные опции, например, полнотекстовый поиск, распознавание и синтез звука и др. (Карпова 2010)

В роли электронного словаря может выступать не только компьютерная программа, но и специальное портативное устройство – словарь-переводчик, пользующийся популярностью, например, у туристов, или сканер-переводчик, такой как Quicktionary. Эти портативные электронные словари обладают достаточно большой словарной базой, могут содержать правила грамматики, произношения и т.д. Сканеры-переводчики обладают и еще одной уникальной функцией: достаточно провести сканером по слову, и на дисплее ручки появится его соответствие на языке перевода.

Тем не менее, судя по тенденциям развития рынка электронной словарной продукции, программные продукты, обладающие широким спектром функций и возможностью установки на КПК, ноутбуки, смартфоны и т.д., составляют очевидную конкуренцию портативным словарям.

Разработчики программного обеспечения, как правило, поставляют его в различных вариациях: одноязычная или многоязычная версия, версия для мобильных устройств, онлайн-версия (используется только в сети Интернет) или оффлайн-версия (для работы в автономном режиме) (Соловьева 2008).

Словари, доступные в режиме онлайн, сегодня оцениваются как наиболее удобные и функциональные. Помимо возможностей, присутствующих в оффлайновых версиях (комплексный поиск в нескольких словарях одновременно, возможность обновления, пополнения, модификации), онлайн-словари имеют и уникальные черты:

  • Широкая представленность и общедоступность

  • Большой объем

  • Возможность параллельных ссылок на другие онлайновые лексикографические источники

  • Предоставление статистических данных о словоупотреблении единиц

  • Отсутствие необходимости отведения места на жестком диске для хранения и др. (Карпова 2010).

Онлайн-словари или интернет-словари – это продукты целого направления практической лексикографии, название которого вошло в терминологический лексикографический аппарат как интернет (или кибер-) лексикография.

Интернет (кибер-) лексикография (cyberlexicography) – направление в современной лексикографической практике, основанное на использовании интернет-пространства для создания словарей (Carr 1997).

Электронный словарь состоит из двух частей: программной оболочки и словарной базы. Если оболочка практически не меняется, то словарные базы можно подключать, отключать и изменять.

Методика работы с электронными словарями достаточна проста. Действия сводятся к выделению слова в программе и вызову словаря по «горячей» клавише либо запуску словаря и вводу нескольких первых букв искомого слова.

С внедрением информационных технологий в профессиональную и образовательную деятельность человека электронные словари получили тотальное распространение в 21 столетии. История вопроса уходит, однако, на пятьдесят с лишним лет назад. Одним из первых лексикографических ресурсов, созданных на базе компьютера (тогда еще электронно-вычислительной машины) стала словарная база Джорджтаунского университета, собранная в процессе широко известного Джорджтаунского эксперимента – Georgetown University Machine Translation Research and Language Project (1956). За ней последовали 7-е (компьютерное) издание толкового словаря Н.Уэбстера (Webster’s 7th Edition, 1963), электронные издания толковых словарей издательских домов «Рэндом Хаус» (Random House Edition of the English Language, 1966) и «Американ Херитидж» (American Heritage Dictionary, 1969), компьютерные версии толковых словарей современного английского языка издательств «Лонгман» (Longman Dictionary of Contemporary English, 1978) и «Харпер Коллинз» (Collins COBUILD English Dictionary, 1979) и др. (Карпова 2010)

Какие электронные словари востребованы переводчиками сегодня? Приведем краткий перечень наиболее популярных словарей, функционирующих в режимах он- и оффлайн.

Двуязычные для общих целей:

  • Lingvo (версии X3, X5)

  • Multitran

  • Polyglossum (версии 3.52, 3.72)

  • МультиЛекс 6 (версии «Компакт» и «Де-люкс»)

Одноязычные для общих целей (в режиме онлайн):

  • American Heritage Dictionary of the English Language (толковый словарь американского варианта английского языка)

  • Merriam-Webster English Dictionary

  • Oxford English Dictionary (толковый словарь в 20 томах, платный доступ в режиме онлайн или на CD-ROM)

  • WordNet English Dictionary and Thesaurus

  • The Internet Language Dictionary

  • AllWords.com Dictionary

  • Encarta World English Dictionary

  • Ultralingua English Languauge Dictionary

  • Wordsmyth English Dictionary

  • Толковый словарь русского языка (под ред. С.И. Ожегова и Н.Ю. Шведовой)

  • Толковый словарь русского языка (под ред. Д.Н. Ушакова)

Одноязычные для специальных целей:

  • Academic Press Dictionary of Science and Technology

  • Free Online Dictionary of Computing

  • The Dictionary of Art

  • Dictionary of Banking and Finance

  • Law Dictionary

  • Medical Dictionary On-line

  • WebElements (он-лайн таблица Д.И. Менделеева с произношением химических элементов и их названиями на 7 языках)

  • Dictionary of Old English

Тезаурусы:

  • Roget’s International Thesaurus

  • Roget’s Thesaurus of English Words and Phrases

  • Specialized On-line Thesauri

  • Synonym Dictionary of English

  • WWWebster Thesaurus

Наиболее популярные каталоги и коллекции словарей:

  • Dictionary.com (www.dictionary.com)

  • Dictionaries (http://math-www.unipadeborn.de)

  • Onelook Dictionaries (более 600 словарей и глоссариев, общий объем – 4,2 млн слов) www.facstuff.bucknell.edu

  • Your Dictionary.com (www.yourdictionary.com)

  • 1000 словарей (www.primavista.ru )

  • dic.academic.ru (подборка русских словарей и энциклопедий)

  • glossary.ru (подборка глоссариев на русском языке, иногда с переводом)

  • WordIQ (толковые словари и энциклопедия)

  • Др.

  1. Переводческий портал

Переводческие порталы – это специальные сайты, организованные и поддерживаемые наиболее активными членами переводческого сообщества (лицами, организациями, союзами и т.д.), публикующие актуальную информацию в области перевода.

Регистрация на переводческих порталах чаще всего осуществляется бесплатно, однако доступ к некоторым зонам и разделам портала может быть предоставлен за определенный взнос.

Порталы публикуют информацию о проводимых встречах, конкурсах и конференциях, обеспечивают доступ к новейшим публикациям в переводческих журналах и альманахах, организуют переводческие форумы и т.п. На порталах также размещаются объявления о вакансиях, анонсы новых лексикографических продуктов и др.

Список наиболее полезных адресов включает:

  • www.proz.com

  • www.translatorscafe.com

  • www.trworkshop.net(Город переводчиков)

  • http://translation-blog.ru

  • www.perevod-pro.ru

  • www.tattolmach.narod.ru

  • Др.

  1. Виртуальная библиотека

Еще одним полезным для переводчика ресурсом, обеспечивающим автоматический поиск информации в Интернете, являются электронные или виртуальные библиотеки (digital / electronic / virtual library). Они размещаются на отдельных веб-порталах и дают обширную информацию о таких СМИ, как новостные блоки, информационные агентства, газеты, журналы, телекомпании, радиостанции и радиопрограммы. Здесь одновременно содержатся самые свежие материалы практически на любую тему и архивные данные за несколько лет.

Самой крупной виртуальной библиотекой в мире является Национальная электронная библиотека при Конгрессе США (National Congress Digital Library). Среди наиболее известных публичных Интернет-библиотек можно назвать The Internet Public Library (IPL). Наиболее востребованные библиотеки на русском языке – это Библиотека XServer.ru (http:// xserver.ru), Библиотека экономической и управленческой литературы (http://aup.ru/library), Электронный каталог Российской национальной библиотеки (http://www.nlr.ru/poisk) и др.

Существуют электронные ресурсы, которые содержат базу данных по сотням газет, журналов, книг и т.д. на разных языках. Среди них:

  • Cities.com (WorldNews Network)

  • Cosmopolis

  • Database of worldwide on-line newspapers

  • InfoPilot-Publishers

  • RapidTree

  • The Flying Inkpot’s World Newspaper Links, etc.

Кроме того, любое крупное информациооное агентство, газета, журнал, теле- и радиоканал в России, Великобритании, США и других странах мира имеют свою электронную версию или архив.

Обращение к электронным библиотекам и архивам помогает переводчику отыскать разнообразную лингвистическую и энциклопедическую (фоновую) информацию по любому возникающему в процессе работы вопросу. Для получения информации в архивах изданий можно воспользоваться одним из следующих способов:

  • Прямой выход на электронный адрес надежных источников информации (газетных или журнальных архивов

  • Расширенный поиск через электронную библиотеку или базу данных

  • Ускоренный поиск выделенного в тектовом редакторе слова или выражения на сайтах газет или журналов с помощью специального макроса (например, GoogleNewspapersUk).

  1. Электронный текстовый корпус

Корпусная лексикография (corpus-oriented lexicography) - область изучения языка на основе текстовых или акустических корпусов при постоянном использовании компьютера в определенных фазах хранения, извлечения и анализа данных (Oii 1998).

Электронный корпус (language corpus / corpora) – это массив естественных текстов современного языка (письменных и устных), представленных на машинном носителе и должным образом упорядоченных с целью их использования в научных и практических целях (Шевчук 2009).

Тематика и жанровая направленность текстов весьма разнообразна: газетные и журнальные статьи, художественная и научная литература, брошюры, доклады, записи бытовых разговоров, радиопередач, интервью и т.д.

Поиск лингвистической информации в корпусе осуществляется с помощью программы-конкордансера (например, AntConc 3.1 (Windows), ConcGram 1.0, WordSmith Tools, WebQuiz, TACT, TACTWeb, Word Splitter, Concordance, Lexa и др.), которая выстраивает соответствующий конкорданс – вертикальный список случаев употребления слова, расположенных в алфавитном порядке в электронном корпусе текстов.

В число задач, решаемых с помощью текстовых корпусов в переводе, традиционно включаются следующие:

  • Исходя из критерия частотности выбрать правильный или наиболее распространенный вариант лексико-грамматического сочетания и проанализировать комбинаторные возможности того или иного слова;

  • Определить правильность выбранной синтаксической конструкции;

  • Выяснить, допустим ли интерлинеарный (буквальный) перевод выражения;

  • Установить коннотации используемого при переводе слова;

  • Проверить грамматические возможности слова и др.

Обращение к текстовому корпусу в переводческой практике имеет целый ряд преимуществ:

  • Быстрый поиск лингвистически релевантной информации в автоматическом режиме;

  • Высокая степень репрезентативности (большое число примеров словоупотребления);

  • Регулярное пополнение состава корпуса и расширение объема выборки;

  • Возможность проведения самостоятельного мини-исследования и самостоятельного принятия решения относительно типовой сочетаемости искомого слова.

Однако использование текстовых корпусов требует от переводчика специальных исследовательских навыков, умения вести поиск, анализировать примеры, делать выводы (Карпова 2010).

Какие текстовые корпусы доступны переводчику сегодня?

Англоязычные текстовые корпусы:

  • Bank of English (525 mln words) – http://www.titania.bham.ac.uk/docs/svenguide.html

  • British National Corpus (100 mln words) – http://corpus.byu.edu/bnc

  • American National Corpus (22 mln words) – http://anc.org

  • The Australian Corpus of English (1 mln words)

  • Brown Corpus of Standard American English (over 1mln words) – http://www.essex.ac.uk/linguistics/Default.aspx

  • International Corpus of English (600 000 words) – http://www.ucl.ac.uk/english-usage/projects/ice-gb

Электронные текстовые корпусы других языков:

  • Национальный корпус русского языка (более 20 млн слов) – http://www.ruscorpora.ru

  • Чешский национальный корпус (100 млн слов)

  • The Finnish Translation Corpus (7 млн слов)

  • IDS Korpora IMS Stuttgart (корпус немецкого языка)

  • English-Norwegian Parralel Corpus, etc.

Более подробную информацию по национальным электронным текстовым корпусам можно получить по ссылке: www.corpora_menu.htm.

Итак, электронные текстовые корпусы дают общее представление относительно закономерностей и тенденций в словоупотреблении, действующих в современном английском языке. Однако они могут оказаться малопригодны для переводчиков, работающих с техническими, экономическими и другими специальными текстами. Для таких целей профессиональные переводчики создают собственные специализированные или виртуальные корпусы (disposable / ad hoc / DIY corpora).

Специализированный (виртуальный) корпус – это обширная по объему подборка текстов по конкретной тематике, специально составленная для поиска переводчиком определенной лингвистической информации. Тексты отбираются из разных источников по строго определенной тематике и обязательно представлены в электронной форме. Такой корпус в сочетании с программой-конкордансером незаменим при переводе, в особенности с родного языка на иностранный (Шевчук 2009).

Лингвисты высоко оценивают возможности специализированных корпусов, в том числе в части представления дополнительной энциклопедической и языковой информации, которую нельзя найти в традиционных источниках (словарях, стилистических руководствах, Интернет-ресурсах и т.п.). Корпус может быть использован для контроля правильности переводческих решений, поиска дефиниций, терминологических дублетов, антонимов, референтов, номенклатурных наименований, значений аббревиатур и др. Инструментом поиска в этом случае выступают особые фразы-индикаторы, например, also called / known as / referred to / a synonym for, etc. (для поиска синонимов), the term is applied to (для поиска дефиниции), designation of (для поиска референта), short for / stands for (для поиска значения аббревиатур) и т.д. (Шевчук 2009)

  1. Терминологический банк данных

Терминологический банк данных / ТБД (term bank) – электронная оболочка данных, разбитых на узкоспециализированные области и ориентированных на определенные группы пользователей, обладающих различными интересами, знаниями и уровнем подготовки.

Структура словарной статьи ТБД обычно выглядит следующим образом:

  • Термин (левая часть)

(Правая часть)

  • Значение термина

  • Эквиваленты термина на других языках

  • Допустимые синонимы

  • Адрес (ссылка на документ, утвердивший термин, например национальный или международный стандарт)

  • Другая дополнительная информация (предметная принадлежность термина, дата последнего редактирования, фамилия создателя словарной статьи и др.)

  • Перекрестные ссылки на другие словарные статьи

Сегодня терминологические банки данных классифицируются по следующим основаниям.

По цели создания:

  • ТБД, ориентированные на обеспечение работ по переводу научно-технической литературы и документации;

  • ТБД, предназначенные для обеспечения информацией о стандартизированной и рекомендованной терминологии.

По адресату:

  • ТБД справочного типа (dictionary type banks), предназначенные для выполнения переводов;

  • ТБД лексического типа (vocabulary type banks), предназначенные для научных исследований.

В работе над переводом технических текстов переводчик может привлекать сведения, содержащиеся в таких современных ТБД, как

  • Банк стандартизованных терминов (Россия)

  • Банк медицинских терминов (Россия)

  • Терминологический банк “Siemens” (более 2,5 млн терминов на 8 языках)

  • ТБД французского бюро по стандартизации

  • “EURODICAUTOM” (ТБД терминологического бюро Комиссии Европейского Союза)

  • “Nokia Termbank” (банк терминов по телекоммуникации, реестр продукции фирмы)

  • “NORDTERM” (“Nordic Termbank”)

  • “MultiTerm” (банк данных, разработанный немецкой компанией “SDL Trados”), etc.

  1. Системы автоматизации перевода

Автоматизация, под которой сегодня понимается применение машинной техники и технологии с целью облегчения человеческого труда, вытеснения его ручных форм и повышения его производительности (Современный экономический словарь 2007), активно внедряется в переводческую отрасль, позволяя переводчику сделать свой труд более сфокусированным, комплексным и творческим (Соловьева 2008:77).

К технологиям автоматизации относятся, прежде всего, технологии машинного перевода (machine / automatic / computer(-aided) translation).

Технологии машинного перевода берут свое начало с середины 40-х годов (см. работы У.Уивера и А.Д. Бута, например, Уивер У.Новая Башня // Машинный перевод. М.: 1957), их разработка тесно связана с развитием систем искусственного интеллекта. В 1954 году машинный перевод был впервые продемонстрирован на практике – уже упоминавшийся нами Джорджтаунский эксперимент. Однако вплоть до конца 50-х годов прошлого столетия ввода систем машинного перевода в промышленную эксплуатацию не осуществлялось даже на экспериментальном уровне. Опубликование отчета Наблюдательного комитета по автоматической обработке текстов Национальной академии наук США, в котором указывалось на экономическую невыгодность машинного перевода и бесперспективность научных исследований в этой области, усугубило пессимизм относительно этого рода проектов и приостановило разработку программ вплоть до конца 60-х годов. Уже в 70-е годы усиление роли информации на разных языках и необходимость оперативного перевода большого количества текстов в условиях научно-технической революции заставили специалистов разных профилей вновь обратить свое внимание на возможности машинного перевода (Семенов 2008, с. 5-8).

В процессе развития системы машинного перевода становятся более гибкими и рассматриваются в одном ряду с другими способами и средствами автоматизации перевода. Совершенствование технологичности систем идет по пути включения человека-переводчика в некоторые переходы между автоматическими процессами. Происходит естественное и удобное подчинение систем автоматического перевода качественным возможностям человека-переводчика (Семенов 2008: 9).

Сегодня, когда информационные потоки буквально захлестывают человечество, востребованность программ машинного перевода как никогда высока.

В основе программ лежит жесткий алгоритм, предполагающий синтаксический и семантический анализ переводимого предложения с последующим подыскиванием эквивалентов на языке перевода. Если текст оригинала написан четким и логичным стилем, а предложения – полные и небольшие по объему, это создает естественные условия для корректного синтаксического уподобления при переводе, и синтаксис переведенного текста будет вполне удовлетворительным. Для решения семантических задач привлекается жесткое распределение по тематикам словарей, к которым обращается программа. При указании приоритетного списка словарей, при постоянном расширении и редакции их словников, программа машинного перевода становится менее зависима от разнообразия и разнородности языковых ресурсов и способна осуществлять более точный выбор соответствия (Семенов 2008: 41).

Качество машинного перевода и рентабельность его систем значительно повышают две дополнительные технологические операции: предредактирование и постредактирование.

Кроме того, нельзя не учитывать тенденцию к формализации языка оперативной коммуникации, проявляющуюся в использовании речевых штампов, аббревиатур, типового ядерного синтаксиса. Все это расширяет сферу применения систем машинного перевода.

Наиболее хорошо известными программами машинного перевода являются системы PROMT, SYSTRAN, а также «он-лайновые переводчики» популярных поисковых систем, например, Google Переводчик и др.

Принципиально иной технологией автоматизации переводческого процесса является технология накопительного перевода (translation memory). Эта технология положена в основу программ, известных как CAT-системы, системы класса «Память переводов» или TM-инструменты (Computer/Aided Translation Systems / Tools).

ТМ-инструменты – это класс программ, предназначенных для накопления, структурирования и хранения в определенном порядке результатов переводческой деятельности, оказывающих активную и эффективную организационную поддержку переводческого процесса, создающих комфортную среду и повышающих производительность труда за счет осуществления рутинных переводческих операций (Перевод: информационные технологии 2009).

Основная идея концепции системы автоматизации перевода – исключение необходимости снова переводить стереотипные (повторяющиеся) фрагменты текста.

Практическое назначение ТМ-инструментов можно обозначить следующим образом:

  • Перевод документации с высокой степенью повторяемости текстов (технической, финансовой, юридической и др.)

  • Локализация программного обеспечения

  • Ведение терминологических глоссариев

  • Проверка качества перевода

  • Создание и распределение переводческих проектов

  • Встраивание в системы документооборота и др.

Главный элемент переводческих инструментов – это создаваемая самим переводчиком база билингв – пары сопоставленных друг с другом сегментов (translation unitsTU) на исходном и переводящем языках. Единица перевода обычно равна предложению, но может быть изменена (фраза, абзац) на усмотрение переводчика (Перевод: информационные технологии 2009).

Одновременно с базой билингв, аккумулирующей исходные предложения и их переводы (Sentence Memory), переводческие инструменты располагают системами терминологического обеспечения (term bases) - программными средствами, осуществляющими автоматический просмотр исходного текста и предлагающими варианты перевода терминов, которые были приняты переводчиком в ранее выполненных и сохраненных в памяти переводах (Перевод: информационные технологии 2009).

Системы терминологического обеспечения создаются в виде одно-, дву- и многоязычных глоссариев. Словарные статьи имеют разветвленную структуру и содержат обширную информацию, необходимую для принятия решения об использовании того или иного термина: термин, аббревиатура, синонимы, определение, контекст, источник, статус, комментарий, рисунки, звукозаписи, перекрестные ссылки и т.д.

Пакет системы, как правило, включает дополнительные сервисные программы, позволяющие более эффективно организовывать работу по формированию базы билингв, а также непосредственно по переводу текстов, позволяя осуществлять поиск по нескольким базам памяти перевода, проверку качества оформления и орфографии, контроль ошибок непосредственно при вводе текста, предварительный просмотр в режиме реального времени и т.д.

Широко известными сегодня являются такие ТМ-инструменты, как Trados (5 Freelance, Studio 2009), DejaVu (DejaVu X), Star Transit (Transit XV), Catalyst (4.0), Wordfast и др. Некоторые из них (Trados, DejaVu, Star Transit) – это дорогие и мощные инструменты, часто промышленного масштаба (используются в переводческих бюро, агентствах, отделах крупных организаций), предназначенные для автоматизации всего процесса перевода: от менеджмента проекта до предоставления результатов перевода заказчику. Существуют и более дешевые виды программ, доступные и переводчикам-фрилансерам: программа Wordfast, Pi-Consult – Across и др.

Итак, в наше время переводческая отрасль развивается впечатляющими темпами. Применение новейших технологий в области лексикографической поддержки переводческих процессов становится важнейшим фактором конкурентноспособности на рынке переводческих услуг. Именно использование современной и качественной электронной лексикографической продукции способствует росту производительности труда переводчиков, расширению спектра оказываемых услуг, повышения качества перевода.

Приложение 2

Лексикографический анализ электронного словаря «Urban Dictionary» (http://www.urbandictionary.com)

Электронные словари сегодня широко доступны пользователю как на компакт-дисках, так и в Интернете. Подобных проектов много, но значительное число из них имеют весьма посредственные по объему и качеству базы данных, а потому могут оказаться малопригодны для использования. Однако существует уникальный в своем роде проект – словарь «Urban Dictionary», запущенный в 1999 г. и расположенный по адресу http://www.urbandictionary.com/.

Авторство словаря не принадлежит определенному издательству – он непрерывно создается трудами сообщества энтузиастов, каждый из которых может добавить в него собственную словарную статью (практика, известная в мировой лексикографии как «лексикография снизу вверх» или «bottom-up lexicography»). Большую часть работы проделывает администрация ресурса, удаляя противоречащие пользовательскому соглашению добавления, остальную работу выполняет сама система, принципы которой рассмотрены далее.

Исходя из метода создания словаря, его единственным достоверным источником является сама жизнь. Пользователи добавляют только те слова, которые сами не раз слышали и произносили в различных жизненных ситуациях. По сути, это книги, газеты, телепередачи и пр.

Объем словника впечатляет: на 27 апреля 2009 г. объем составил 3 920 800 единиц, и с каждым часом эта цифра растет.

В макроструктуре электронного словаря можно выделить словник и типичные для сетевых ресурсов разделы: пользовательское соглашение terms of service»), политика конфиденциальности privacy policy»), отзывы feedback»), предложение рекламодателям advertise»), описание технологии technology»), консультация в реальном времени live support»), чат chat»), блог blog»).

Как часть макроструктуры следует оценивать поисковую систему – основополагающую функцию электронного словаря. Фактически слова не имеют строго установленного порядка – они хранятся в базе данных и проиндексированы для поиска. Тем не менее, можно говорить о прямом алфавитном порядке построения словника, так как при отображении результатов поиска найденное слово дополнительно выводится в колонке слева в окружении наиболее близкими к нему по алфавиту словами. В качестве примера ниже приводится сопроводительная колонка слов к слову (неологизму) «ricer».

  • […]

  • Ricep

  • ricepicker

  • ricepower

  • riceps

  • ricer

  • Ricer Angle

  • Ricer Citation

  • ricer convention

  • ricer exuse

  • […]

Поисковая система достаточно эффективна и при ошибке в наборе способна предложить возможные соответствия. Например, в ответ на запрос с предполагаемой ошибкой «gogle» выводится серия похожих результатов: «google», «search», «googl», «googol».

Наряду с традиционным машинным поиском предусмотрен второй способ освоения словаря – побуквенный просмотр; здесь слова выстраиваются по алфавиту.

В качестве примера ниже приводится алфавитный список слов при просмотре единиц на букву «Q».

  • […]

  • Qaeda

  • qaf

  • QAFFING

  • qaffy

  • qafgasm

  • Qag

  • qagen

  • Qagget

  • qahba

  • qaid

  • qailow

  • […]

Микроструктура словаря включает заглавное слово, дефиницию, иллюстративный материал, указание на время добавления и авторство словарной статьи, рейтинговую систему, синонимический ряд (если предусмотрено пользователем), почтовый скрипт. Какие бы то ни было фонетические, грамматические, прагматические и другие пометы полностью отсутствуют – передаваемую ими информацию приходится самостоятельно извлекать из толкований и иллюстраций к заглавным словам.

Заглавной единицей могут выступать:

– буквы (например, «a», «g»);

– отдельные слова (например, «baller», «phat»);

– акронимы и аббревиатуры (например, «AOL», «SACS», «RSI»);

–сложносоставные слова (например, «twitterpated», «technolust»);

–словосочетания, обычно двучленные (например, «emo alphabet», «intelligent design», «inbox rot»; «Cosmic Jewish Zombie», «National Hangover Day», «new world order»);

– цитаты (например, «I believe you have my stapler», «o the world just keeps on spinnin», «Oh My God! They Killed Kenny!»);

– антропонимы (например, «Hillary Clinton», «Michael Jackson», «Michael Jordan»);

– наборы символов (например, «?:(», «>__<», «>_>»);

– некоторые другие категории (кроме словообразовательных основ и аффиксов, обнаружить которые не удалось).

Значительно количество страноведческой информации: имена известных людей, спортивных команд, обычаев, модных тенденций и пр.

Одно слово может быть истолковано многократно. Каждая словарная статья, т. е. каждое отдельное толкование одного и того же заглавного слова, снабжена рейтинговой системой: читатель может добавить или убавить балл у каждой статьи, что скажется на ее популярности и позиции в общем списке. Так, самые лучшие по мнению посетителей толкования оказываются вверху списка, а наименее удачные – сдвигаются вниз. Пример рейтинговой системы: «uleh – 151 up, 28 down ».

Дефиниции элементарны. При наличии у слова нескольких значений их обычно записывают одно под другим, в произвольном порядке, разделяя цифрами. Например, в одной из дефиниций «furry» находим следующее:

1. adjective.: having or coated in fur;

2. adjective.: being related to the “furry” community, such as artwork, stories;

3. mistake: a misspelling of fury =P;

4. noun.:

a. One who shows interest in things that can be described with the “furry” adjective;

b. One who prefers to imagine himself as more animalistic than he is.

Иллюстративный материал не является строго документированным. Приводимые примеры произвольны; пример иллюстраций в словарной статье приведен ниже.

dotcomrade 2606 up, 613 down

An Internetacquaintance; someone you chat with but have never actually met.

So who’s this NrdPowr32 guy?”

I dunno. Just a dotcomrade of mine.”

Подобным контекстам можно доверять лишь потому, что они созданы носителями языка.

Особенно популярные статьи содержат ряд графических иллюстраций, также добавленных пользователями.

Время добавления и авторство статьи автоматически вносятся в каждую словарную статью. Выглядит это так: «by mad at the worldFeb 27, 2003».

По имени автора статьи можно провести поиск и найти все внесенные им в словарь слова.

При описании слова пользователь может создать синонимический ряд, обозначив те слова, которые, как он считает, очень близки по смыслу к вводимому им слову. Например: «Skittles yummy,sweet,sour,chewycandy».Прав был составитель, или нет – решать нужно самостоятельно.

Почтовый скрипт позволяет прямо со страницы со словарной статьей отправить ссылку на нее по электронной почте.

В процессе использования словаря непрерывно ощущается непринужденность и юмористический тон, особенно в словесных и графических иллюстрациях.

Таковы основные характеристики электронного словаря «Urban Dictionary». Его главный недостаток и одновременно главное достоинство – это отсутствие строгого контроля за содержанием, свободный порядок создания словника. Несмотря на свою анти-академическую направленность, он является незаменимым переводческим инструментом, помогающим истолковать новейшие слова, которых нет ни в одном другом словаре. Ресурс отлично зарекомендовал себя при переводе текстов песен, субтитров к фильмам, газет, журналов, всевозможных Интернет публикаций; обрел должную популярность и сегодня используется как носителями языка для повышения общей эрудиции, так и изучающими английский во многих странах мира.