Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Болгарчук Р. - Книга 3.0 Слушайте! 2017.pdf
Скачиваний:
65
Добавлен:
01.12.2019
Размер:
14.79 Mб
Скачать

Ст. 281 из 343

выбрать полную версию, если нет времени и важнее узнать главное, то сокращенную. В общем, не буду повторяться, все уже описывал выше. Просто предлагаю поразмышлять над самой идеей и большими перспективами, которые дает гибкая книга именно при конкретных задачах. Особенно в эру информации увеличивающейся чуть ли не в геометрической прогрессии. Поэтому, главным мерилом критики и разумного выбора, должен стать прагматичный подход и целесообразность. К тому же, я ведь не отрицаю классическую вордовскую цифровую книгу, в которой обычный текст на страницах, а добавляю к ней широкие возможности и перспективы, в которых каждый может найти то, что ему больше подходит. Одни могут читать версию книги для развлечения, и так информация лучше запомнится. Другим захочется бегло просмотреть и определить суть, и они захотят рассмотреть блок схем. Третьим, как мне, нет времени читать, но можно выкроить время послушать – подойдет версия, более адаптированная именно для прослушивания.

Кстати, самое интересное то, что при желании читатель таких книг мог бы ознакамливаться с разными версиями, закрепляя пройденный материал, если он носит научный или обучающий характер. В результате такой различной проработки тех же книг, вероятно, у человека будут возникать больше, именно разнообразных идей, которые бы у него не возникли при работе по старинке (с одной классической версией книги). Различная подача материала, в свою очередь, может запустить, так сказать, цепную реакцию когнитивного взрыва представления информации и принципиально новой эпистемологической деятельности. К тому же, индивидуальный подход к особенностям усвоения именно одного и того же материала в разных формах дает широкий простор в сфере педагогики. Каждый бы ребенок или взрослый человек мог бы выбрать именно ту подачу материала, которая ему больше подходит, либо при желании проработать необходимый материал повторно, но уже в другой интерпретации. Как говориться -- «повторение мать учения». Но занудное повторение того же материала, многих отталкивает от использования данного инструмента обучения. А вот если тот же материал будет преподноситься в разных вариантах, это даже заинтересует, и даст возможность его лучше освоить. В общем, простор для творчества очень велик. Было бы желание.

Смежные технологии.

Как видим книга, со временем, в радужных перспективах, перестанет быть книгой в обычном для нас понимании. Она, как и человек, сольется с другими технологиями. Поэтому на них так же хотелось бы кратко остановиться.

Будущее синтезаторов речи.

Начну с уже полюбившихся мне синтезаторов. Во-первых, ХОРОШИЕ движки для разных языков должны быть бесплатными. На данный момент таких мало. Мне удалось найти бесплатные движки чисто случайно, после длительных поисков, когда я буквально уже дописывал данный труд. Т.е. они еще не набрали популярности, и над ними еще стоит работать. А ведь голосовые движки являются самим сердцем и мозгом программы синтеза речи. Очень бы хотелось, чтобы на данной идеи остановились такие гиганты как Googl и Oracle. Им бы было под силу создать голосовой движок. Но он должен быть гибкий, что бы сами пользователи могли редактировать словари произношения, с легкостью добавлять плагины и устранять баги. Данные программы должны легко устанавливаться практический на любые современные устройства. Они должны поддерживаться десяткой самых распространенных операционных систем.

Гибридная схема работы с текстом «уши-глаза».

Разработчики должны понять, что текст воспроизводимый синтезатором часто бывает необходимым и посмотреть. Поэтому мне кажется, стоит либо встроить возможность произношения, а главное слежения и выделение произносимого текста в самых распространенных текстовых редакторах, просмотрщиках и веб браузерах. Т.е. что бы слушая текст, я в любой момент мог посмотреть на то, что проговаривается. Таким образом, можно

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Ст. 282 из 343

было бы останавливаться на том или ином моменте и посмотреть трудно произносимое слово, картинку, график и т.д. Не буду описывать всех нюансов такого просмотра и настройки поведения, но при необходимости могу с радостью посоветовать разработчикам, основываясь на своем опыте работы с подобными программами, как лучше реализовать данную опцию с точки зрения пользователя.

Закладки и пометки.

Как уже писал ранее, в программах для синтеза речи, уже можно с легкостью ставить закладки. Это очень удобно. Но мне сильно не хватает функции быстрого добавления пометок. В идеале было бы хорошо, что бы ту или иную пометку можно было бы оставлять как напечатав её, так и оставив голосовую заметку – к примеру: если у вас руки заняты. Развитие таких идей в комплексе с другими технологиями буквально бы преобразило современный Мир, а в частности информационную сферу. Переведя книги уже на совершенно новый принципиальный уровень. Увы, это уже очень далекое будущее. Тем не менее, я постараюсь приблизительно описать, как это возможно реализовать с учетом тех программ, которые уже есть сейчас, но пока еще не связаны и недоработаны.

Закладки можно подразделить на группы: 1 –согласен.

2 – не согласен.

3 – требует дополнительного рассмотрения.

4 – новое не понятное слово, фраза.

5 – очень полезный материал (для цитирования).

Так же, помимо этого, сделать возможность добавлять голосовые пометки, которые могли бы преобразовываться в текст. Эти пометки, надо как-то так интегрировать, что бы их можно было не только проработать на любом цифровом устройстве, но и отправить в интернет, к примеру, на форум обсуждения данной книги. Что бы как автор, так и читатели могли проанализировать данную критику. Помимо онлайн сервисов не стоит забывать и о необходимости сохранения закладок, экспорта их в разные форматы и на разные устройства. Очень часто разработчики хотят привязать пользователя к своим онлайн сервисам. Т.к. им выгодно постоянно держать руку на пульсе и контролировать пользователей, а вот хороших программ для офлайн становится все меньше. До сих пор даже нет нормальной программы для создания добротной библиотеки на ПК. Мне приходится самому раскладывать все книги в папочки и пользоваться разрозненным софтом типа архивариуса, и эврифинг. Есть жалкие подобия создания каталогов книг, но пока не нашел не одного достойного. Но вернемся непосредственно к синтезу речи.

Синтез речи при дублировании фильмов.

Уже упоминал такую возможность в разделе «Программа для чтения субтитров.». И такие программы уже есть. Так же у меня есть надежды, что на YouTube появится возможность дублирования видео, используя субтитры и синтезаторы речи, но вот YouTube пока до этого не дорос. Хотя повторюсь технических проблем, которые бы этому препятствовали, нет.

Развивая эту тему, еще хотелось бы отметить, что было бы прекрасно, что бы на YouTube появилась не только возможность прослушивать дублированные видео на родном языке, но и более широкий функционал: выбор голоса, тембра, выразительности, скорости проговаривания и т.д...

Особенно важна настройка и гибкая регулировка скорости воспроизведения. Например, хотелось бы что бы была возможность автоматического замедления или паузы того или иного участка видео, если текст не успевает проговориться. Скажу из личного опыта, такое, к сожалению, на данный момент часто встречается и приходится искать золотую середину, между скоростью воспроизведения субтитров, а иногда видео и пониманием произнесенного. Т.е. если сделать что бы произносило медленно и разборчиво, звук не будет успевать за видеорядом, а если сделать что бы произносило очень быстро, то попросту не будет понятно,

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Ст. 283 из 343

что произносится. Думаю, для хороших программистов не составило бы труда создать функцию автоматической подгонки скорости произносимого текста к видеоряду.

Синтез речи и понимания речи машиной.

Помимо проговаривания текста есть еще одна весьма важная задача, которая ставится перед ИТ. Она является как бы противоположностью синтеза речи и её решить труднее. Синтез речи, грубо говоря, и очень упрощенно, это произнесение последовательности конкретных символов – букв. И с эти машины уже худо-бедно справляются, т.к. буквы одинаковы и их не много. То, что человеку не привычно слушать монотонно произнесенные буквы с неправильным ударением, это уже другой вопрос. Но в принципе, с проблемой синтеза речи, справились. С пониманием речи все обстоит намного сложнее, т.к. звуки человеческой речи, которые машине предстоит преобразовать обратно в буквы, весьма разнообразны. Разнообразность их вызвана массой факторов: личной индивидуальной особенностью произносящего, окружающей обстановкой, микрофоном, и многим другим. Поэтому так трудно из голоса, особенно не знакомого вычленить и идентифицировать те или иные звуки фразы, слова, буквы. Тем не менее, и в данном направлении уже есть кое какие успехи. Думаю, уже сейчас можно было бы использовать эти две технологии вместе, с предварительной тренировкой второй и подстройке к конкретному голосу собеседника, конкретному микрофону и т.д. Эту идею уже взяли на вооружение и используют некоторые кол-центры и др. организации, умеющие экономить свои деньги и делать перспективные инвестиции. Надеюсь, что в будущем именно связка этих двух технологий будет объединена в одной программе, которую любой обычный пользователь сможет бесплатно установить и использовать на ПК. Возможно, синтез и понимание речи станет визитной карточкой многих устройств и частью интерфейса ОС способной общаться с людьми привычным для них способом. А уже в дальнейшем, при создании хорошего аналитического ядра, подключенного к мощной базе, границы будут стерты еще больше. Но это уже относится больше к оптимистичным планам и далекому будущему. Тем не мене, раз данные технологии есть уже сейчас, именно проблем в том, чтобы использовать их в одном пакете, нет ни каких препятствий.

Дабы (исправил было даны) мои слова не казались пустым звуком, дам ссылку на один очень интересный сайт https://speechpad.ru/ с помощью него, я надиктовал данные строки (два абзаца) голосом. Правда для меня это было непривычно, потому что печатаю быстрее, чем говорю, особенно если касается продуманных речей. Тем не менее, даже меня возможности этого ресурса и программы приятно удивила, поскольку надиктовывал некоторые предложения довольно быстро. Естественно программа до этого мой голос не слышала. Никакой предворительной подстройки, калибровки не было. На диктовка производилась в микрофон далеко не лучшего качества, который я купил лет 5 назад за пол доллара. К сожалению программа, на данный момент не ставит знаки пунктуации. Да и в словах быльи не значительные ошибки. Которые, я оставил в данном тексте, выделив красным. Возможно, надо говорить разборчиво и внятно прямо в микрофон, тогда ошибок вовсе не будет.

Можно с таким же успехом (практический без ошибок) надиктовывать и украинский текст. Надеюсь, это, уже сейчас мне очень пригодится в работе. Потому что ко мне часто приходят сотрудники, которые не умеют пользоваться клавиатурой и просят меня сделать то, что в принципе может сделать эта программа.

При регистрации доступны более расширенные возможности. К сожалению, насколько я понял, часть функции платные. Но с учетом того, что данную программу я нашёл практически случайно, за 5 минут, уже это весьма обнадеживает. Если немного подождать и поискать более целенаправленно, вероятно отыщутся программы лишённые и этих незначительных недостатков. Способные вводить текст с знаками пунктуации прямо в ворд или другой текстовый редактор. Кстати, версия программы доступны и для андроид. Приложение скачать, можно с гугл маркета. Но установка её в BlueStacks и попытка что-то надиктовать пока не увенчалась успехом. Несмотря на то, что голосовой поиск там работает нормально.

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Ст. 284 из 343

В настоящее время в голосовом блокноте имеется кнопка Транскрибация. Это дает возможность работать не только с надиктовываемым текстом, но и с видео и аудиоматериалом, записанным ранее. О приимуществах и необходимости создания текста с видео и аудио уже писал. Доступен перевод аудиотекстов из форматов html5 видео и аудио, а также из видеозаписей youtube. Как это сделать подробно показано в видео «транскрибирование аудио». А с помощью функции синхронного перевода, надеюсь, в будущем отпадет необходимость в живых переводчиках. Языковая проблема, возникшая по легенде, со времен Вавилона, рухнет. И появится уже рабочая цифровая Вавилонская рыбка.

Вот еще не плохая статья по данной теме «Голосовой набор текста – онлайн сервисы распознавания речи в текст».

Проговаривание сообщений от ОС.

На данный момент такая функция не распространена и очень недоработанная. Но уже сейчас есть утилиты для произношения сообщений, которые выводит на экран система.

Особенно это актуально, к примеру, в линукспупирус. Там очень хорошая обширная и понятная справка. Но иногда читать пару абзацев сообщения системы, выведенное на экран, некогда или банально лень. И тут бы на помощь пришли синтезаторы речи, которые бы и проговаривали подобные послания. Естественно для удобства хорошо было бы, если бы при таком проговаривании его можно было бы остановить в любой момент, изменить скорость проговаривания, проговорить тот или иной участок сообщения повторно и т.д. Опять же, думаю, это все не составит труда реализовать. Но пока доработанного такого проекта я не нашел. Даже в экранном дикторе (Windows), да и в других ОС базовые возможности уже реализованы. Увы, в них на протяжении уже, как минимум, нескольких лет, все не как не удосужатся добавить возможность поставить на паузу, или выбрать проговаривание именно определенного текста. Диктор Windows до сих пор тараторит все подряд, что надо и что не надо.

Восприятие книги телом.

Писал, про это шутя, в начале раздела, посвященного Книге 2.0. Шутки шутками, но все токи данная технология весьма необходима и востребована. Например, для таких несчастных, которые, по тем или иным причинам, стали слепоглухонемыми. Конечно, таких людей немного, но представьте себя хоть на минутку на их месте. Впрочем, представить может помочь книга Скороходовой. Скачать наверно можно тут http://readli.net/ или на сайтах, которые давал выше. Жаль, что в то время не было таких технологий как сейчас. А вообще, не удивлюсь, если окажется что и сейчас не смотря на технологии, их не кто не применяет, и до сих пор используют исключительно дактилологию или (более справедливо для слепоглухонемых) так называемую дактильно-контактную речь (ДКР) и дермографией23 (письмо на руке). Хотя, надо будет погуглить, есть ли, что не будь помимо шрифта Брайля. Существует ли программа передачи звуков или др. сигналов с помощью вибратора. Тогда бы можно было, просто на просто, положить телефон в карман и слушать книги ногой, не занимая не только глаза, но и уши. Это было бы весьма востребовано для школьников и студентов на экзаменах и не только. Никто бы не догадался, что вы воспринимаете книгу телом, ощущая вибрации определенной частоты, в которых закодированы слова. В эру информационных технологий грех не использовать каждую возможность, для получения информации, которая возрастает, по меньшей мере, в геометрической прогрессии.

К сожалению, по запросу «вибратор» и «программы», озабоченный Googl, выдает совершенно не то, что я ищу. Хотя, мне удалось нарыть по другим запросам интересную перчатку, а точнее статью: «Перчатка для слепых и глухонемых пользователей мобильных телефонов», работающие по принципу азбуки Лорма. Но использовать такую перчатку на экзамене довольно подозрительно, поэтому я делаю упор на др. части тела.

23 на ладони другого человека пальцами воспроизводят очертание букв

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Соседние файлы в предмете Информационная технология в печатном деле