
- •Билет № 1
- •Билет № 2
- •2. Клиппирование речевого сигнала.
- •3. Выделение формантных параметров речи.
- •Билет № 3
- •Билет № 4
- •Билет № 5
- •1. Методы кодирования- востановления формы речевых сигналов.
- •2. Аналоговые методы синтеза формантных частот.
- •3. Синтезаторы третьего типа используют метод цифрового моделирования голосового тракта человека.
- •Билет № 6
- •Билет № 7
- •Билет № 8
- •Билет № 9
- •Билет № 10
- •3.4.4.2. Форматы пакетов
- •3.4.4.2.1. Маркерный пакет
- •3.4.4.2.2. Маркер начала кадра (sof)
- •3.4.4.2.3. Пакет данных
- •3.4.4.2.4. Пакет подтверждения
- •Билет № 11
- •Билет № 12
- •Билет № 13
- •Билет № 14
- •Билет № 15
- •Билет № 16
- •Билет № 17
- •Билет № 18
- •Рассмотрим общее устройство и принцип работы пзс.
- •1. Методы кодирования- востановления формы речевых сигналов.
- •2. Аналоговые методы синтеза формантных частот.
- •3. Синтезаторы третьего типа используют метод цифрового моделирования голосового тракта человека.
- •Билет № 19
- •Билет № 20
- •4.1. Еще в 1996 г. Компания Lernout & Hauspie Speech Products
- •4.2. Управление голосом Vocollect
- •4.3. Система распознавания речи «Dragon Naturally Speaking»
- •4.4. Разработка «Горыныч».
- •4.5 Фирма црт (Центр речевых технологий, Ст. Петербург)
- •«Икар Лаб»
- •Назначение и области использования.
- •Функциональные возможности
- •3.6.1.Качество печати.
- •3.6.2. Скорость печати.
- •3.6.3.Память принтера.
- •3.6.4. Бумага и лотки
- •3.6.5. Чернила и тонер.
- •3.6.6. Подключение к компьютеру.
- •Билет № 21
- •Билет № 22
- •Билет № 23
- •3.2. Матричный принтер.
- •3.3. Струйный принтер.
- •3.4. Лазерный принтер.
- •3.5. Сублимационный принтер.
- •Билет № 24
- •Билет № 25
- •Билет № 26
- •Билет № 27
- •3.4.4.2. Форматы пакетов
- •3.4.4.2.1. Маркерный пакет
- •3.4.4.2.2. Маркер начала кадра (sof)
- •3.4.4.2.3. Пакет данных
- •3.4.4.2.4. Пакет подтверждения
- •Билет № 28
Билет № 20
Основные области практического применения речевых технологий. Конкретные примеры.
Каждый пользователь мечтает о том, что бы иметь возможность подключить микрофон (или диктофон) к компьютеру и видеть весь поток слов в текстовом редакторе или, что бы его слова воспринимались, как команды к исполнению соответствующими устройствами, по его желанию.
4.1. Еще в 1996 г. Компания Lernout & Hauspie Speech Products
предоставила лицензию на разработанную ею технологию распознавания речи (Automatic Speech Recognition, ASR) корейской корпорации LG Group для использования в широком спектре продуктов - бытовой электронике, средствах связи и компьютерных системах.
В частности, устройства Hands Free Phone ("телефон, оставляющий руки свободными"). Пользователи такого телефона могут голосом диктовать требуемый номер и выбирать те или иные функции. LG использует, так же технологию распознавания речи при создании мультимедиа-ПК, в системах автонавигации, в "обучаемых" роботах.
Технология распознавания речи, разработанная Lernout & Hauspie многоязычна. В настоящее время она поддерживает целый спектр языков: американский и британский английский, французский, немецкий, а так же корейский, арабский, китайский и японский. Именно многоязычность послужила решающим фактором при выборе лицензируемой технологии ASR.
Lernout & Hauspie, так же предоставила лицензию на свою технологию ASR компании Acer Sertek, входящей в состав Acer Group
для использования распознавания речи при разработке мультимедиа-приложений, которыми будут комплектоваться ПК и периферийные устройства производства Acer.
4.2. Управление голосом Vocollect
Впервые представленная на мировом рынке около 10 лет назад, технология распознавания речи (или голосовая технология) доказала свою эффективность в широком спектре отраслей. Практика показывает, что использование технологии распознавания речи, например на складах позволяет:
Увеличить производительность более чем на 35%;
Увеличить точность операций по сбору заказов до 99,99%;
Сократить время, необходимое для обучения персонала на 50 %;
Минимизировать дефицит товара на складе.
Фирма Psion Teklogix, например разработала комплексную голосовую систему Vocollect®, включающую в себя терминал Talkman T2, по сути это многофункциональный носимый индустриальный компьютер, управляемый голосом, с поддержкой беспроводной связи.
Терминал Talkman T2 использует систему распознавания речи Vocollect®, интегрированную с технологией синтеза речи, предоставляющую пользователям связь в реальном времени со складом, производством и другими бизнес - системами. Внутренняя архитектура терминала, совместимая со стандартом Wi-Fi, предоставляет возможность интеграции в существующие или новые радиосети.
Как работает система?
Система Voice-Directed Distribution™ принимает выдаваемые центральным компьютерной системой управления (ЦКСУ) задачи (например, список отбора или запрос на пополнение) и передает сотрудникам голосовые пошаговые указания по выполнению их повседневных задач. Терминал Talkman преобразует данные в речевые команды, направляя сотрудника к определенному проходу и ячейке. Сотрудники подтверждают свое местонахождение, произнося в микрофон гарнитуры системы распознавания речи числовой идентификатор (контрольное число).
Система распознавания речи преобразует слова сотрудника в текст и отправляет эти данные по беспроводной сети обратно в ЦКСУ. При выполнении задачи сотрудник общается с ЦКСУ через носимый на ремне терминал Talkman и гарнитуру системы распознавания речи (наушники с микрофоном). Система производит учет количества единиц отобранного товара только после произнесения сотрудником
правильного проверочного числа. В этот момент задание считается завершенным, и пользователь направляется к следующему месту, указанному в задаче.
Все это позволяет:
выполнять работу быстрее, с большей точностью и более высоким уровнем безопасности;
исправлять ошибки инвентаризации сразу при их появлении;
снижать количество ошибок при комплектовании заказа;
контролировать работу персонала;
снижать количество бумажной документации.
Программное обеспечение Vocollect®
Программа VoiceClient установленная на терминале Talkman T2 включает в себя индустриальную систему распознавания речи. Vocollect® организована как базирующаяся на распознавании слов и зависимая от голоса пользователя система, предназначенная специально для зашумленных производственных помещений.
Система может поддерживать пользователей, говорящих на разных языках и распознавать отдельные слова отфильтровывая любые лишние фоновые звуки и шум.