
Осень 13-весна 14 курс 1-2 ОрТОР (сейчас это называют ТОЛААД) / Информатика / ССРР / Распознавание речи. Часть 1. Классификация систем распознавания речи Хабрахабр
.htmРаспознавание речи. Часть 1. Классификация систем распознавания речи / Хабрахабр var crtg_nid="2580"; var crtg_cookiename="cto_rtt"; var crtg_varname="crtg_content"; function crtg_getCookie(c_name){ var i,x,y,ARRCookies=document.cookie.split(";"); for(i=0;i0)document.getElementsByTagName("head")[0].appendChild(crtg_script); else if(document.getElementsByTagName("body").length>0)document.getElementsByTagName("body")[0].appendChild(crtg_script); var _gaq = window._gaq || []; window.onerror = function(msg, url, line) { //var preventErrorAlert = true; //_gaq.push(['_trackEvent', 'JS Error', msg, navigator.userAgent + ' -> ' + url + " : " + line]); //return preventErrorAlert; }; jQuery.error = function (message) { _gaq.push(['_trackEvent', 'jQuery Error', message, navigator.userAgent]); } войти через TM ID постыq&aсобытияхабыкомпании (function(){ var custom = []; /* custom params */ custom[1] = 'artificial_intelligence'; /* end of custom params */ var std = {gender:100, age:101},i;for(i in std){try{custom[std[i]]=eval(i)}catch(e){} } custom.getStd = function(){for(var i=0,j,s=[];i 0) { $('.'+name+'_inner_banner').show(); } } if( typeof(url) !== 'undefined') { $('.'+name+'_inner_banner .block_url').attr('href', url); } } //if (true) // show_inner_banner_block('mva'); //else new adriver("adriver_banner_1586921565", {sid:179440, bt:52, bn:3}); комментарии (39) –1 Sirob039, 15 июля 2009 в 22:29 # Эшелон то распознает. Не исключено что и Русскую речь.
habrahabr.ru/blogs/lenta/1986/ 0 domage, 15 июля 2009 в 22:41 # ↵ ↑ Про применение систем распознавания речи в спецслужбах я могу только многозначительно промолчать. Если уж Google позволил себе сделать свободно-доступной систему логов телефонных разговоров, то за ширмой, я думаю, уже выжали из этой технологии все что возможно. И анализ эмоций, и распознавание диктора, и поиск по «слову-маркеру»…
В той ссылке которую вы дали, насколько я понял, ведется речь об анализе речи на предмет эмоциональной насыщенности. При этом, про распознавание слов и речи ничего не говорится.
Скорее всего, оно уже реализовано, и если вы по междугородге говорите на чистейшем англицком — то, скорее всего, вы уже записаны ;0) А вот с русскими словарями, к сожалению, пока что проблемы… 0 Sirob039, 15 июля 2009 в 22:51 # ↵ ↑ А что промолчать? По Гуглу и сужу. Русский во времена холодной войны был приоритетным по прослушке, так что вполне могли сделать. И еще не пришло время рассекречивать такие проекты — конечно в статьях основанных на фактах, а не на домыслах, не будет речи о распознавании.
Почему именно по междугородке? Думаете у «них» есть технология прослушивания проводных переговоров? У «нас» то есть СОРМ, а у «них» есть что то кроме радиоразведки? +1 domage, 15 июля 2009 в 22:54 # ↵ ↑ Промолчу, ибо не компетентен :0)
И про прослушку знаю не больше, чем в «Популярной Механике» пишут. +2 HounD, 16 июля 2009 в 10:54 # ↵ ↑ en.wikipedia.org/wiki/Lawful_interception +1 domage, 16 июля 2009 в 10:59 # ↵ ↑ Если интересно:
www.computerra.ru/414976/?phrase_id=10675692 0 HounD, 16 июля 2009 в 11:11 # ↵ ↑ Это вы к чему? Мой пост был комментарием к фразе: «У «нас» то есть СОРМ, а у «них» есть что то». Пожалуйста, знакомтесь что есть у них и как называется. А skype дело темное и исследоваию не подлежит. Хотите спать спокойно молчите ;). Ну или как минимум только открытые технологии. 0 Castle, 15 июля 2009 в 23:28 # ↵ ↑ Америка давно не скрывает, что слушает и распознаёт переговоры по сот. Подробностей не помню — в инете много инфы про это. Это не скрывают. Как всегда говорят против терроризма :)
Наши, сотовые тоже давно слушают, и не скрывают сильно это. И текст распознают тоже.
Помню как-то по орт даже репортаж был, мол готовилось заказное убийство на какого-то серьёзного человека нашей страны, и спалили это благодаря тому, что обсуждали заказ открытым текстом по сот телефону. Я тогда ещё удивился, как так, зачем рассказали это массам про эту технологию. 0 Halt, 17 июля 2009 в 00:31 # ↵ ↑ Ну на самом деле, это еще далеко не факт что там применялось именно распознавание. Ну или баба клава на проводе :)
Или они там прямо про парсеры говорили? 0 Castle, 17 июля 2009 в 00:43 # ↵ ↑ ты представляешь сколько нужно баб Клав?
Да, так и говорили про распознание текста по словарю. 0 Halt, 17 июля 2009 в 00:49 # ↵ ↑ Да не, это понятно… я просто подумал про то что изначально была ориентировка на этого человека, а потом уже раскопали.
А ты значит говорил что в принципе первая зацепка этого дела была вытянута из разговоров произвольных людей, так? 0 Castle, 17 июля 2009 в 11:23 # ↵ ↑ именно! поэтому я и удивился, что это народу рассказали. Обычному смертному не надо знать что его слушают. 0 Halt, 17 июля 2009 в 12:38 # ↵ ↑ Ага, понятно :) Ну а по поводу смертных, я думаю им банально пофиг. Или решили выпендриться.
Вообще, это в каких нибудь европах бы вызвало некий негативный резонанс, а тут… 0 Fiery_Ice, 23 июля 2009 в 00:31 # ↵ ↑ Ну на самом деле, поскольку эта система узкоспециализированная — то ей не нужно быть супервысокотехнологичной: если просто надиктовывать ей текст то скорее всего она большую часть его не распознает, или будет работать ужасно медленно (с большим словарем); а вот на ограниченном словаре фраз типа «застрелить, оружие, взрыв, ...» — в самый раз. А этого достаточно, что бы пометить конкретный разговор, который впоследствии будет перепроверен «вручную». А раз достаточно — то тратится на приближение к универсальному распознаванию вряд ли кто-то будет, т.к. при высокой универсальности еще надо как минимум сохранить ту узкоспециализированность, а это сложно. Усложнять себе работу без улучшения результата (им то нужно потенциальных преступников отлавливать, а не софт для перевода речи в тест, разработать) — бессмысленные затраты времени и денег. Соответственно ничего сверхкрутого у спецслужб быть не обязано (хотя, в принципе, и может). +1 RenegadeMS, 15 июля 2009 в 22:30 # очень милая статья, автор молодец перелопатив материал
немного забегу вперед и спрошу, нетерпится — сколько планируется их в цикле? про что еще поведаете? +1 domage, 15 июля 2009 в 22:52 # ↵ ↑ Сколько — пока не знаю точно.
Пока думаю что не меньше 3-4 частей обзорных.
Дальше — война план покажет.
Что расскажу — вот тут написал: domage.habrahabr.ru/blog/64572/#comment_1797664 +1 Kron0S, 15 июля 2009 в 22:36 # а про мат аппарат будет? и про реализованные библиотеки для распознования речи +2 domage, 15 июля 2009 в 22:50 # ↵ ↑ Посмотрим как пойдет.
Мат аппарат будет обязательно (правда, боюсь с формулами тут придется повозиться).
Хотя бы в общих чертах расскажу про цепи маркова, вейвлеты, фильтрацию. От нейросетей тоже никуда не деться.
А с реализованными библиотеками будет труднее: без испытания про них говорить нечего, а на это требуется тьма времени… +1 Krofes, 15 июля 2009 в 22:38 # Великолепная статья! Очень жду продолжения.
А нет ли у вас ссылок хороших по теме? Было бы очень интересно почитать про это дело по-глубже, про вейвлет-преобразование то же… 0 domage, 15 июля 2009 в 22:47 # ↵ ↑ Ах эти вейвлеты…
Да, про них буду писать. К сожалению, сил пока нет скомпоновать всю библиографию, но для затравки — самое оно (практически библия распознавателя речи):
Huang Xuedong. Spoken language processing: a guide to theory, algorithm and system development. –New Jersey: Prentice Hall PTR, 2001. – 980 с.
У меня где-то была, как найду — выложу обязательно. 0 Krofes, 15 июля 2009 в 22:50 # ↵ ↑ Нашел… :) Спасибо больше, постараюсь что-нибудь прочитать и усвоить, надеюсь знания языка хватит :)
Желаю вам ещё много хороших статей! :) 0 domage, 15 июля 2009 в 23:05 # ↵ ↑ Можешь сразу ссылку кинуть сюда? +4 Krofes, 15 июля 2009 в 23:27 # ↵ ↑ Взял на себя смелость перезалить, ибо Рапидшара как-то совсем сдает, 5-минутные задержки — это круто.
narod.ru/disk/10964878000/Spoken%20Language%20Processing%2C%20