Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
kursach.doc
Скачиваний:
44
Добавлен:
16.02.2016
Размер:
183.81 Кб
Скачать

Предметна область

В епоху глобальних комунікацій і інтеграцій велику популярність придбали міжнародні конференції. Сьогодні проведення міжнародних конференцій - це необхідність в досягненні правильного і здорового співробітництва жителів планети, компаній різних країн і держав.

   Жоден захід за участю іноземних гостей не обходиться без синхронного перекладу. Якщо на заході задіяні понад, ніж дві робочі мови, наприклад , російська , англійська , французька , арабська , то єдиний спосіб у досягненні розуміння - це синхронний переклад. Оренда обладнання для синхронного перекладу необхідна при організації міжнародних заходів.

 Обладнання дозволяє виконувати переклад одночасно з промовою оратора, з відставанням в 2-3 секунди. Перекладач - синхроніст здійснює переклад в звукоізольованій кабіні, тим самим, не заважаючи аудиторії і оратору. Учасники заходу слухають переклад за допомогою приймачів синхронного перекладу і навушників, з можливістю вибору каналу своєї рідної мови для комфортного сприйняття інформації.

Синхронний переклад має значні переваги перед послідовним перекладом: оперативність, скорочення часу заходи, чіткість, точність перекладу, можливість відключення свого навушника слухачем (у разі, якщо він розуміє мову і вважає за краще оригінал). Для заходів за участю людей різних національностей синхронний переклад дозволяє одночасно переводити виступы на різні мови, синхроністи, перебуваючи у своїх кабінках, не заважають оточуючим.

Синхронний переклад може здійснюватися двома варіантами:

  • переклад заздалегідь підготовленого тексту з можливими змінами мови оратора в ході виступу;

  • без наявності попереднього тексту і підготовки синхроніста, безпосередньо по мірі надходження інформації.

Але зараз у всьому світі намагаються автоматизувати такі системи синхронного перекладу. Щоб можна було обходитись без участі людей.

Метою проекту є створення системи для розпізнавання людської мови і отримання синхронного перекладу з однієї мови на іншу у вигляді голосового сигналу.

Об'єктом дослідження є процес проектування системи для розпізнавання людської мови і отримання синхронного перекладу з однієї мови на іншу у вигляді голосового сигналу.

ПОСТАНОВКА ЗАДАЧІ

Для створення системи розпізнавання людської мови і отримання синхронного перекладу з однієї мови на іншу у вигляді голосового сигналу необхідно вирішити наступний ряд задач:

- Дослідження літературних джерел,

- Побудова діаграми варіантів використання,

- Побудова діаграми аналізу класів,

- Побудова діаграми послідовності класів,

- Отримання звукового сигналу,

- Отримання відеосигналу,

- Розпізнавання жестів,

- Розпізнавання голосу,

- Висновок голосового сигналу у вигляді тексту,

- Переклад тексту на потрібну мову,

- Синтез мови .

Системні вимоги для роботи системи розпізнавання людської мови і отримання синхронного перекладу з однієї мови на іншу у вигляді голосового сигналу:

Мінімальні системні вимоги:

Процесор: 50 MHz ;

Оперативна пам'ять: 64 Mb RAM ;

Вільне місце на HDD: 50 Mb ;

Пристрої взаємодії з користувачем : клавіатура , мікрофон , веб -камера ;

Інші пристрої : звукова карта , колонки.

Рекомендовані системні вимоги:

Процесор: 70 MHz ;

Оперативна пам'ять: 128 Mb RAM ;

Вільне місце на HDD: 50 Mb ;

Пристрої взаємодії з користувачем : клавіатура , мікрофон , веб -камера ;

Інші пристрої : звукова карта , колонки.

Програма у вигляді утиліти може працювати під операційною системою Windows XP , Windows 7 , Windows 8. Потребує підключенні до Інтернету для коректної роботи , при цьому необхідно щоб мова говорить задовольняло ряду критеріїв

- Розбірливість мови ;

- Природність ( натуральність ) мови .

У систему голосового перекладу може надходити голосовий сигнал або здійснюється введення текстової інформації з клавіатури. Так само передбачено розпізнавання жестів для людей з обмеженими можливостями. На виході системи є можливість отримати перекладений текст на екрані, отримати звукове відтворення стандартним голосом. Програма підтримує роботу з базою даних і здійснює переклад з російської на англійську і навпаки.

МЕТОДИ РЕАЛІЗАЦІЇ

Для автоматичного розпізнавання мови можна використовувати бібліотеку Google Speech. Першочерговим завданням є запис звуку у форматі FLAC з частотою 8 кГц. Є можливість почати автоматичну запис при перевищенні рівня на якийсь поріг. Такий алгоритм позбавляє від необхідності натискати кнопки початку запису і зупинки. При відповідних настройках рівнів і кількості спрацьовувань програма відловлює факт наявності корисної складової з мікрофона, далі відбувається відправка в Google для розпізнавання і прийом відповіді. Записаний файл за допомогою бібліотеки Synapse відправляється в Google на розпізнавання.

Наступний етап роботи системи - це здійснення перекладу тексту на потрібну мову. Існує кілька методів перекладу тексту: послівний переклад (слова вихідного тексту перетворюються в слова переказного тексту ); інтерлінгвістіческом машинний переклад ( вихідний текст трансформується в абстрактне уявлення, яке не залежить від мови ); системи машинного перекладу, засновані на прикладах; статистичний машинний переклад (порівняння великих обсягів мовних пар). Враховуючи всі переваги і недоліки існуючих систем в роботі була використана система статистичного машинного перекладу , яка адекватно справляється з усіма видами лексики.

Перевагами статистичного машинного перекладу є:

• Швидка настройка;

• Легкість додавання нових напрямів перекладу;

• Гладкість перекладу.

Наступним завданням є синтез мови. Для того, щоб синтезоване мовлення звучала натурально, необхідно вирішити цілий комплекс завдань, пов'язаних як із забезпеченням природності голосу на рівні тембру, плавності звучання і інтонації, так і з правильною розстановкою наголосів, розшифровкою скорочень, чисел , абревіатур і спеціальних знаків .

Синтезатор мови складається з двох частин - аналізатор мови і синтезатор звуків мови. Синтезатор на основі параметрів, отриманих від аналізатора, синтезує звуки мови. Таким чином, стає можливим імітувати голоси. Аналізатор може бути автоматичним, або ж дані можуть бути підготовлені для введення в синтезатор вручну. Голосовим джерелом вважаються коливання повітря, вироблені голосовими зв'язками. Самим джерелом звуку є перша похідна за часом від об'ємної швидкості потоку. Деякі автори говорять, що додатково потрібно враховувати і другу і третю похідну. Коливання зв'язок відбуваються в обсязі, тому додатково розглядається поршневий джерело, який виходить в результаті вертикального зсуву зв'язок.

Структура ідеалізованої системи автоматичного синтезу мови складається з декількох блоків.

1) Визначення мови тексту (відбувається за допомогою особливого програмного комплексу, що надається зазвичай розробниками систем машинного перекладу. Все, що потрібно для визначення мови тексту - це ввести його в спеціальну форму, і натиснути кнопку « Визначити мову »).

2) Нормалізація тексту (здійснюється поділ введеного тексту на слова і решта послідовності символів. До символів належать, зокрема, знаки пунктуації та символи початку абзацу).

3) Лінгвістичний аналіз: синтаксичний, морфемний аналіз і т.д. (кожному слову тексту (кожної словоформи) необхідно приписати інформацію про його вимові, тобто перетворити на ланцюжок фонем або, інакше кажучи, створити його фонемную транскрипцію).

4) Формування просоідіческіх характеристик (здійснюється трьома основними блоками, а саме: блоком розстановки синтагматических кордонів (паузи), блоком приписування ритмічних і акцентних характеристик (тривалості та енергія), блоком приписування тональних характеристик (частота основного тону)).

• Фонемний транскриптор.

• Формування керуючої інформації.

• Отримання звукового сигналу.

Вона не описує ні одну з існуючих реально систем , але містить компоненти, які можна виявити в багатьох системах. Автори конкретних систем, незалежно від того, чи є ці системи вже комерційним продуктом або ще перебувають у стадії дослідної розробки, приділяють різне увагу окремим блокам і реалізують їх дуже по- різному, відповідно до практичних вимог .

Алгоритм методу аналізу і синтезу мови:

1. мовний сигнал надходить на вхід звукової карти комп'ютера , яка перетворює його в цифрову форму;

2. здійснюється сегментація мовного потоку з метою виділення елементарних мовних фрагментів і визначення їх параметрів: вокалізованності, розмітки на періоди основного тону вокалізованих фрагментів, параметрів спектра. Розмір і структура фрагментів залежить від завдань розв'язуваних синтезом;

3. елементарні мовні фрагменти об'єднують в звукову базу;

4. відповідно до структури синтезируемой мовної послідовності здійснюється вибір фрагментів з бази і модифікація їх просодических характеристик, в результаті чого формується звуковий сигнал;

5. сформований цифровий мовний сигнал відтворюється звуковою картою комп'ютера або зберігається у файл для подальшого зберігання та / або обробки.

ПРОЕКТУВАННЯ СИСТЕМИ

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]