Добавил:

678080Aspire Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный университет гражданской авиации

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Распознавание речи. Часть 1. Классификация систем распознавания речи Хабрахабр

.htm

Скачиваний:

Добавлен:

30.09.2018

Размер:

171.85 Кб

Скачать

☆

Распознавание речи. Часть 1. Классификация систем распознавания речи / Хабрахабр var crtg_nid="2580"; var crtg_cookiename="cto_rtt"; var crtg_varname="crtg_content"; function crtg_getCookie(c_name){ var i,x,y,ARRCookies=document.cookie.split(";"); for(i=0;i0)document.getElementsByTagName("head")[0].appendChild(crtg_script); else if(document.getElementsByTagName("body").length>0)document.getElementsByTagName("body")[0].appendChild(crtg_script); var _gaq = window._gaq || []; window.onerror = function(msg, url, line) { //var preventErrorAlert = true; //_gaq.push(['_trackEvent', 'JS Error', msg, navigator.userAgent + ' -> ' + url + " : " + line]); //return preventErrorAlert; }; jQuery.error = function (message) { _gaq.push(['_trackEvent', 'jQuery Error', message, navigator.userAgent]); } войти через TM ID постыq&aсобытияхабыкомпании (function(){ var custom = []; /* custom params */ custom[1] = 'artificial_intelligence'; /* end of custom params */ var std = {gender:100, age:101},i;for(i in std){try{custom[std[i]]=eval(i)}catch(e){} } custom.getStd = function(){for(var i=0,j,s=[];i 0) { $('.'+name+'_inner_banner').show(); } } if( typeof(url) !== 'undefined') { $('.'+name+'_inner_banner .block_url').attr('href', url); } } //if (true) // show_inner_banner_block('mva'); //else new adriver("adriver_banner_1586921565", {sid:179440, bt:52, bn:3}); комментарии (39) –1 Sirob039, 15 июля 2009 в 22:29 # Эшелон то распознает. Не исключено что и Русскую речь.

habrahabr.ru/blogs/lenta/1986/ 0 domage, 15 июля 2009 в 22:41 # ↵ ↑ Про применение систем распознавания речи в спецслужбах я могу только многозначительно промолчать. Если уж Google позволил себе сделать свободно-доступной систему логов телефонных разговоров, то за ширмой, я думаю, уже выжали из этой технологии все что возможно. И анализ эмоций, и распознавание диктора, и поиск по «слову-маркеру»…

В той ссылке которую вы дали, насколько я понял, ведется речь об анализе речи на предмет эмоциональной насыщенности. При этом, про распознавание слов и речи ничего не говорится.

Скорее всего, оно уже реализовано, и если вы по междугородге говорите на чистейшем англицком — то, скорее всего, вы уже записаны ;0) А вот с русскими словарями, к сожалению, пока что проблемы… 0 Sirob039, 15 июля 2009 в 22:51 # ↵ ↑ А что промолчать? По Гуглу и сужу. Русский во времена холодной войны был приоритетным по прослушке, так что вполне могли сделать. И еще не пришло время рассекречивать такие проекты — конечно в статьях основанных на фактах, а не на домыслах, не будет речи о распознавании.

Почему именно по междугородке? Думаете у «них» есть технология прослушивания проводных переговоров? У «нас» то есть СОРМ, а у «них» есть что то кроме радиоразведки? +1 domage, 15 июля 2009 в 22:54 # ↵ ↑ Промолчу, ибо не компетентен :0)

И про прослушку знаю не больше, чем в «Популярной Механике» пишут. +2 HounD, 16 июля 2009 в 10:54 # ↵ ↑ en.wikipedia.org/wiki/Lawful_interception +1 domage, 16 июля 2009 в 10:59 # ↵ ↑ Если интересно:

www.computerra.ru/414976/?phrase_id=10675692 0 HounD, 16 июля 2009 в 11:11 # ↵ ↑ Это вы к чему? Мой пост был комментарием к фразе: «У «нас» то есть СОРМ, а у «них» есть что то». Пожалуйста, знакомтесь что есть у них и как называется. А skype дело темное и исследоваию не подлежит. Хотите спать спокойно молчите ;). Ну или как минимум только открытые технологии. 0 Castle, 15 июля 2009 в 23:28 # ↵ ↑ Америка давно не скрывает, что слушает и распознаёт переговоры по сот. Подробностей не помню — в инете много инфы про это. Это не скрывают. Как всегда говорят против терроризма :)

Наши, сотовые тоже давно слушают, и не скрывают сильно это. И текст распознают тоже.

Помню как-то по орт даже репортаж был, мол готовилось заказное убийство на какого-то серьёзного человека нашей страны, и спалили это благодаря тому, что обсуждали заказ открытым текстом по сот телефону. Я тогда ещё удивился, как так, зачем рассказали это массам про эту технологию. 0 Halt, 17 июля 2009 в 00:31 # ↵ ↑ Ну на самом деле, это еще далеко не факт что там применялось именно распознавание. Ну или баба клава на проводе :)

Или они там прямо про парсеры говорили? 0 Castle, 17 июля 2009 в 00:43 # ↵ ↑ ты представляешь сколько нужно баб Клав?

Да, так и говорили про распознание текста по словарю. 0 Halt, 17 июля 2009 в 00:49 # ↵ ↑ Да не, это понятно… я просто подумал про то что изначально была ориентировка на этого человека, а потом уже раскопали.

А ты значит говорил что в принципе первая зацепка этого дела была вытянута из разговоров произвольных людей, так? 0 Castle, 17 июля 2009 в 11:23 # ↵ ↑ именно! поэтому я и удивился, что это народу рассказали. Обычному смертному не надо знать что его слушают. 0 Halt, 17 июля 2009 в 12:38 # ↵ ↑ Ага, понятно :) Ну а по поводу смертных, я думаю им банально пофиг. Или решили выпендриться.

Вообще, это в каких нибудь европах бы вызвало некий негативный резонанс, а тут… 0 Fiery_Ice, 23 июля 2009 в 00:31 # ↵ ↑ Ну на самом деле, поскольку эта система узкоспециализированная — то ей не нужно быть супервысокотехнологичной: если просто надиктовывать ей текст то скорее всего она большую часть его не распознает, или будет работать ужасно медленно (с большим словарем); а вот на ограниченном словаре фраз типа «застрелить, оружие, взрыв, ...» — в самый раз. А этого достаточно, что бы пометить конкретный разговор, который впоследствии будет перепроверен «вручную». А раз достаточно — то тратится на приближение к универсальному распознаванию вряд ли кто-то будет, т.к. при высокой универсальности еще надо как минимум сохранить ту узкоспециализированность, а это сложно. Усложнять себе работу без улучшения результата (им то нужно потенциальных преступников отлавливать, а не софт для перевода речи в тест, разработать) — бессмысленные затраты времени и денег. Соответственно ничего сверхкрутого у спецслужб быть не обязано (хотя, в принципе, и может). +1 RenegadeMS, 15 июля 2009 в 22:30 # очень милая статья, автор молодец перелопатив материал

немного забегу вперед и спрошу, нетерпится — сколько планируется их в цикле? про что еще поведаете? +1 domage, 15 июля 2009 в 22:52 # ↵ ↑ Сколько — пока не знаю точно.

Пока думаю что не меньше 3-4 частей обзорных.

Дальше — война план покажет.

Что расскажу — вот тут написал: domage.habrahabr.ru/blog/64572/#comment_1797664 +1 Kron0S, 15 июля 2009 в 22:36 # а про мат аппарат будет? и про реализованные библиотеки для распознования речи +2 domage, 15 июля 2009 в 22:50 # ↵ ↑ Посмотрим как пойдет.

Мат аппарат будет обязательно (правда, боюсь с формулами тут придется повозиться).

Хотя бы в общих чертах расскажу про цепи маркова, вейвлеты, фильтрацию. От нейросетей тоже никуда не деться.

А с реализованными библиотеками будет труднее: без испытания про них говорить нечего, а на это требуется тьма времени… +1 Krofes, 15 июля 2009 в 22:38 # Великолепная статья! Очень жду продолжения.

А нет ли у вас ссылок хороших по теме? Было бы очень интересно почитать про это дело по-глубже, про вейвлет-преобразование то же… 0 domage, 15 июля 2009 в 22:47 # ↵ ↑ Ах эти вейвлеты…

Да, про них буду писать. К сожалению, сил пока нет скомпоновать всю библиографию, но для затравки — самое оно (практически библия распознавателя речи):

Huang Xuedong. Spoken language processing: a guide to theory, algorithm and system development. –New Jersey: Prentice Hall PTR, 2001. – 980 с.

У меня где-то была, как найду — выложу обязательно. 0 Krofes, 15 июля 2009 в 22:50 # ↵ ↑ Нашел… :) Спасибо больше, постараюсь что-нибудь прочитать и усвоить, надеюсь знания языка хватит :)

Желаю вам ещё много хороших статей! :) 0 domage, 15 июля 2009 в 23:05 # ↵ ↑ Можешь сразу ссылку кинуть сюда? +4 Krofes, 15 июля 2009 в 23:27 # ↵ ↑ Взял на себя смелость перезалить, ибо Рапидшара как-то совсем сдает, 5-минутные задержки — это круто.

narod.ru/disk/10964878000/Spoken%20Language%20Processing%2C%20

Соседние файлы в папке ССРР

#
30.09.2018740.86 Кб19467815.ppt
#
30.09.201867.96 Кб3z_5f0e49fc.jpg
#
30.09.2018106.65 Кб63ИнфCтарков реферат.docx
#
30.09.2018143.95 Кб16История развития систем распознавания речи как мы пришли к Siri Хабрахабр.htm
#
30.09.2018285.62 Кб10Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit Блог компании Яндекс Хабрахабр.htm
#
30.09.2018171.85 Кб18Распознавание речи. Часть 1. Классификация систем распознавания речи Хабрахабр.htm
#
30.09.2018138.29 Кб13Распознавание речи. Часть 2. Типичная структура системы распознавания речи Хабрахабр.htm
#
30.09.2018149.91 Кб8Распознавание речи. Часть 3. Голосовой тракт, слуховой тракт Хабрахабр.htm
#
30.09.2018564.27 Кб254Современные технологии распознавания речи.pptx