Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТ.docx
Скачиваний:
10
Добавлен:
08.06.2015
Размер:
106.18 Кб
Скачать

Системы автоматического синтеза речи

Методы:

  1. Кодирование (запись в двоичной системе речевых сигналов с их последующим восстановлением)

    1. По существу ПК здесь служит устройством для записи речи, слова и фразы записываются в ПК заранее и в нужный момент воспроизводятся по командам);

    2. Недостаток:

  • Сказать фразу, не введённую в память, нельзя;

  • Для хранения речевых сигналов в непосредственной форме нужен большой объём памяти;

  • Преимущества:

    • Естественное звучание речи;

    • По качеству речь приближается к человеческой;

  • Фонетический синтез речи (акустическое моделирование голосового тракта человека)

    1. Синтезатор по этому методу принципиально отличается от синтезатора по первому методу – имеет неестественное звучание, говорит голосом робота;

    2. Обычно осуществляется по орфографическому тексту, написанному человеком, ПК в нём умеет преобразовывать буквы в фонемы, фонемы в аллофоны и синтезировать непрерывный речевой сигнал с использованием аллофонов диктора, выбираемых и базы данных;

    3. Наиболее перспективен, так как речь генерируется действительно самим ПК.

  • Математическое моделирование голосового тракта человека:

    1. Словарь в синтезаторе этого вида, как и в первом методе, создаётся с участием человека, но здесь в память записываются не слова и фразы, а производится выделение числовых характеристик звуков речи и интонации фраз, что позволяет уменьшить объём требуемой памяти.

    2. Речь естественна, для её генерации числовые характеристики по специальным командам преобразуются в звуковые сигналы.

    Сейчас ведутся разработки над тем, чтобы синтезированная речь была звучала живо, эмоционально, естественно. Решение этой проблемы позволит создавать системы синхронного перевода, активнее использовать ПК при обучении языку, а также людям с нарушениями зрения.

    Возможности современного ПК

    Известно, что компьютер был изобретен как средство вычисления, однако постепенно к его возможностям добавлялись и другие функции. Сегодня уже невозможно сходу перечислить все сферы применения компьютера. Наиболее остроумным определением назначения компьютера является следующее: ”Компьютер есть средство решения тех задач, которые человек в состоянии ему поручить на данном уровне развития техники”.

    Проследим, как расширялась область применения ПК по мере развития его графических, коммуникационных и интеллектуальных возможностей.

    Компьютерная графика сыграла важнейшую роль в развитии вычислительной техники, определив десятки направлений использования современного компьютера. Благодаря 3D-графике археологи смогли воссоздать древнейшие умершие города; палеонтологи – увидеть умерших животных; криминалисты – создать фотороботы людей, находящихся в розыске, идентифицировать угнанные автомобили.

    Мощные графические серверы позволяют ученым исследовать и оценивать в виртуальной 3-мерной графической среде сейсмические данные и модели нефтяных месторождений. Компьютерная графика революционизировала процесс создания мультипликаций, позволила создавать в кино виртуальные декорации любой сложности.

    Приложения виртуальной реальности нашли применение в индустрии развлечения. Архитекторы получили в свои руки инструмент градостроительного планирования, медики – инструмент диагностики заболеваний человека.

    В области лингвистики ПК позволяют автоматически создавать аннотации и рефераты текстов, проверять орфографию и морфологию, выполнять перевод не только текстов, но и речевых сообщений с одного языка на другой; синтезировать научно-технические тексты, распознавать и синтезировать человеческую речь ( е в полном объеме).

    Внедрение сетей позволило превратить компьютер из вычислительного в коммуникационное устройство. С появлением INTERNET пошел следующий век в эволюции человечества – век «информационных технологий», век развития компьютеров и компьютерных сетей, время, когда вовремя доставленная информация стала цениться как никогда раньше. В настоящее время ЭВМ задействована практически во всех отраслях производства, науки и обороне стран. Человек стремится максимально облегчить себе работу во всем, хочет, чтобы ЭВМ делало за него практически всю работу, а для этого пытается разработать более совершенные машины. ЭВМ нового поколения – это машины недалекого будущего. Основным их качеством должен быть высокий интеллектуальный уровень. Это будут компьютеры с искусственным интеллектом. В них будет возможным ввод с голоса, голосовое общение, машинное «зрение», машинное «осязание». Многое уже практически сделано в этом направлении.

    Базы данных (БД) и лингвистические информационные ресурсы (ЛИР)

    БД– совокупность определенным образом упорядоченных сведений о некоторых объектах.

    Объекты- это сведения, факты, события, процессы. Объект может быть материальным(студент, товар, машина) и нематериальным (событие - поход в цирк, процесс - перевод текста, факт - поступление в университет). В жизни каждый объект обладает определенными свойствами или атрибутами (вес, скорость, цвет), которым приписываются определенные значения: батон весит 400 гр., скорость машины 90 км./ч.

    В БД атрибуты представляются элементами данных или просто данными, а их значения – значения данных.

    ПримерБД - Студент

    Номер зачетной книжки

    Ф.И.О. студента

    Пол

    Год рождения

    Факультет

    Группа

    Стипендия

    357411

    Арбузов А.И.

    м

    1978

    англ.

    302

    50000

    358125

    Белова Р.Г.

    ж

    1979

    фр.

    201

    80000

    Объектом является студент. Он описывается атрибутами: № зач. книжки, ФИО,.. Эти атрибуты для каждого студента имеют определенное значение. В памяти ПК атрибутам № зачетной книжки, ФИО …соответствуют элементы данных или просто данные. Таким образом, данное– это некоторый показатель, который характеризует заданный объект и принимает для конкретного элемента объекта некоторое значение. Группа данных, которая образует одну строку, называется записью. В рассмотренном примере запись состоит из 7 элементов.

    Чтобы пользователь мог обратиться к записи, ее необходимо идентифицировать. Одно из данных выбирается в качестве идентификатора (первичного ключа). В качестве идентификатора выбирают данное, которое является уникальным для каждого объекта. Например в нашем случае № зачетной книжки. Если несколько записей имеют одно и тоже множество данных с однотипной информацией то говорят, что эти записи имеют один формат. Множество записей с одним форматом называют файлом. А множество файлов образуют базу данных. Допустим, что объект Студент будет описан не в 1 файле, а в 3 файлах.

    Номер зачетной книжки

    Ф.И.О. студента

    Пол

    Год рожд.

    Факультет

    Группа

    Специальность

    Стипендия

    357411

    Арбузов А.И.

    м

    1978

    англ.

    302

    051

    С1

    358125

    Белова Р.Г.

    ж

    1979

    фр.

    201

    054

    С2

    Причем цифры специальностей и размеры стипендий можно также представить в виде следующих таблиц (файлов в компьютерной БД)

    Специальность

    Шифр

    Название

    051

    английский и немецкий.языки.

    052

    французский и немецкий языки

    Стипендия

    Код

    Размер

    С01

    50000

    С02

    80000


    Эти три файла в совокупности и составляют БД – Студент

    Основные функции БД

    1. Поиск информации в БД

    2. Модификация информации, находящейся в БД:

      1. добавление;

      2. удаление

      3. редактирование

    Системы управления базами данных (СУБД)

    СУБД– совокупность программных средств, позволяющих осуществлять создание и ведение базы данных..

    Типы СУБД:

          1. Настольные СУБД по степени сложности подразделяются:

    а) СУБД для обработки небольших объемов информации (MSOUTLOOK)

    б) СУБД, ориентированные на пользователя, не умеющего программировать (EXCEL,LOTUS)

    в) Сложные СУБД, ориентированные на разработку приложений (FoxBase,MSAccess)

          1. Серверные СУБД – используют архитектуру “клиент-сервер”, т.е. осуществляют централизованное хранение и обработку данных (Informix,MSSQLServer).

    Основные функции СУБД

    1. Обеспечить создание структуры БД (определить, какая информация будет храниться, какие атрибуты, типы данных)

    2. Модификация информации, находящейся в БД:

      1. добавление;

      2. удаление

      3. редактирование

    3. Поиск информации

    Лингвистические информационные ресурсы– одна из составляющих информационных ресурсов.Под информационным ресурсом понимают некоторый интеллектуальный ресурс, результат коллективного творчества

    К пассивным формам информационных ресурсов относят книги, журналы, газеты, словари, энциклопедии, патенты, базы и банки данных и т.п.

    Активные формы включают алгоритмы, модели, программы, базы знаний

    Лингвистические информационные ресурсы - это множество определенным образом организованных речевых и языковых данных, находящихся на машинных носителях информации и используемых в различных сферах практической деятельности (образовании, промышленности, экономике, культуре, искусстве, издательстве

    В самом общем виде ЛИР – это своеобразная лингвистические БД, которые можно обновлять и в которых можно искать ту или иную информацию. Лингвистические ресурсы необходимы как пользователям ПК, так и различным компьютерным системам, связанным с обработкой текста речи: реферирования, аннотирования и перевода текстов, автоматического анализа текста, синтеза речи и текста.

    Пассивные лингвистические информационные ресурсы включают:

    1. Письменный лексикон представлен одноязычными и многоязычными лексиконами. В общем смысле словарь - это справочная книга, которая содержит слова (морфемы, словосочетания, идиомы и т.п.), расположенные в определенном порядке (различном в разных типах словарей). В нем может содержаться толкование значения описываемых единиц, а также различная информациюо них. Любой словарь может быть представлен в виде реляционной БД

      1. частотно-алфавитный словарь словоформкакого-либо текста – простейшая лингвистическая БД;

      2. словоуказательболее сложная БД. В ней, кроме абсолютной частоты употребления словоформы в тексте, указываются номера страниц и строк на странице, где встретилась данная словоформа.

      3. конкордансыещё более сложный тип БД. В них каждая словоформа текста характеризуется не только численными показателями (частотой, номером страницы, номером строки и т.д.), но и некоторым контекстом, в котором она употреблена. Как правило, этот контекст состоит из 3-х предложений: предложения, в котором встретилась словоформа, предложения, стоящего перед основным предложением, и предложения, стоящего после него

      4. энциклопедиисловари, содержащие характеристики не слова как такового, а обозначенного им предмета, факта или явления. Существует достаточно большое число различных энциклопедий на машинных носителях информации. Наиболее известна среди них энциклопедия "Britannica". Она включает 82000 статей и 700 дополнительных материалов, опубликованных с 1768 года. Не менее известны французские энциклопедии "TonslessavoireduMonde", "Lemondesur CD-ROM", "Versailles" и др. На русском языке издана "Большая Энциклопедия Кирилла и Мефодия

      5. тезаурус- принципиально иной тип словарей. В нем в явном виде указаны семантические связи между определенной частью его лексических единиц. Как правило, такие словари строятся для текстов достаточно узкой проблемной области: вычислительной техники, музыки, кораблестроения, сельского хозяйства и т.д.

      6. терминологическим словарь(ТС) – словарь, основной единицей которого является термин.Термин- это слово или подчинительное словосочетание, имеющее специальное значение, выражающее и формирующее профессиональное понятие и применяемое процессе познания и освоения научных и профессионально-технических объектов и отношений между ними.

    2. Письменный текстовый массив (корпус текстов, т.е. совокупность текстов, являющаяся достаточной для обеспечения надежных научных выводов о некотором языке, диалекте или ином другом подмножестве языка).

      1. Могут быть использованы:

    • В лексикографии и лексикологии (для составления различных словарей, определения значений многозначных слов, выявления ассоциативных связей слов в тексте, выделения терминов и терминологических словосочетаний и т.п.).

    • В грамматике (для определения частоты употребления грамматических морфем в текстах различного типа, выявления наиболее употребляемых типов словосочетаний и предложений, определения значений синонимичных морфологических единиц, частоты употребления классов слов и т.д.).

    • В лингвистике текста (для дифференциации типов текста, создания конкордансов, выявления связи между предложениями в абзацах и между абзацами «т.д.).

    • При автоматическом переводе текстов (для поиска контекстов слов, имеющих несколько переводных эквивалентов, поиска переводных эквивалентов терминологических и фразеологических словосочетаний в параллельных текстах и т.д.).

    • В учебных целях (для выбора цитат, отдельных фрагментов произведений, примеров, используемых в процессе создания учебников и учебных пособий.

  • таггированные корпусы текстов(от англ,tag - 'индекс, помета'). Все слова такого корпуса получают некоторые буквенные или цифровые индексы, которые обозначают их грамматические, лексические, семантические или структурные признаки. Таких индексов может быть несколько.

  • Фонетические лингвистические ресурсы В настоящее время общепринято, что для создания машиночитаемых фонетических корпусов используется транскрипция на основе орфографического представления звуковречи с дополнительными знаками, передающими (при необходимости) просодические, паралингвистические и другие особенности произношения.

    1. Фонетические корпусы текстов широко используются для решения следующих задач:

    • сопоставительного изучения устной и письменной форм языка;

    • изучения грамматических и лексических особенностей устной речи;

    • исследования фонетических особенностей диалектов;

    • построения частотных списков фонем и их сочетаний;

    • изучения акустических свойств речевых единиц и их использования в психолингвистических и лингвистических экспериментах;

    • создания компьютерных систем, распознавания и синтеза устной речи.

  • Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]