Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lekcia_1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.1 Mб
Скачать

2.5.6. Средства речевого ввода

Средства речевого ввода (устройства речевого ввода и необходимые программные средства) открывают широкие возможности и повышают удобство общения с ПЭВМ для руководителей высокого ранга. В будущем, видимо, эти средства вытеснят клавиатуры в силу гораздо большей их скорости и удобства ввода информации в ПЭВМ. Пока же возможности средств речевого ввода весьма узки и они используются, в основном, для ввода ограниченного набора команд.

Средства речевого ввода оцениваются и (частично) классифицируются по следующим параметрам:

1) возможности распознавать слитную речь;

2) степени зависимости от диктора;

3) быстродействию;

4) объему словаря;

5) вероятности ошибок интерпретации слов;

6) стоимости.

По первому параметру средства речевого ввода делятся на две основные группы: средства, обеспечивающие распознавание непрерывной, слитной речи, и средства для распознавания изо­лированных слов (команд), разделенных искусственными паузами. Решение первой задачи суще­ственно сложнее, так как необходимо не только идентифицировать последовательность звуков, но и подвергать предложение анализу (в том числе и смысловому) для разделения его на слова.

По второму параметру средства речевого ввода подразделяются на зависимые и не зависимые от диктора. Зависимость от диктора практического интереса не представляет. Не зависимые от диктора средства, в свою очередь, делятся на средства без подстройки под диктора и средства с подстройкой. Первые характеризуются низкой точностью распознавания речи, ресурсоемки и не обеспечивают большой словарный запас. Вторые же являются наиболее перспективными. Они осуществляют «привыкание» к тому или иному пользователю путем неоднократного повто­рения эталонных слов и запоминания его особенностей. Приступая к использованию настроенной таким образом системы, пользователь вводит в нее свой идентификатор или фамилию, при помощи чего осуществляется автоматическая адаптация к нему.

В настоящее время различными изготовителями выпускается широкая номенклатура средств речевого ввода.

Так, например, американская фирма Logical Business Machines предлагает систему Voicecraft для семейства PC IBM. Она способна распознавать до 32000 слов, которые размещаются в наборе словарей емкостью 500 слов каждый. Словари хранятся в запоминающем устройстве, и любой из них включается в работу по мере необходимости. На распознавание слова затрачивается 200 мс. Для семейства PS/2 IBM фирмой Dragon Dictate предлагается система Dragon Dictate-MCA, которая может распознавать одновременно до 30000 слов при словаре в 80000 слов, причем на идентификацию слова требуется не более 2 с. Стоит такая система 9000 долл.

Устройство речевого ввода для отечественной учебной ПЭВМ «Агат» представляет собой одноплатный модуль размером 250x125 мм, вставляемый в гнездо расширения ПЭВМ. Оно позволяет распознавать отдельные слова или короткие словосочетания и является адаптируемым к диктору. Максимальная длительность речевого сигнала, воспринимаемого устройством, сотавляет 1,5 с. Минимальная длитель­ность паузы между отдельными словами — 0,21 с. Объем словаря — 64 слова, время же распознавания слова не превышает 1 с. Точность распознавания лежит в пределах 85 — 100 %.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]