Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Болгарчук Р. - Книга 3.0 Слушайте! 2017.pdf
Скачиваний:
66
Добавлен:
01.12.2019
Размер:
14.79 Mб
Скачать

Ст. 133 из 343

Программы в общем.

После того, как у вас появилась цифровая версия книги, перейдем к следующему пункту раздела «Алгоритм действий.», а именно переводу книги в нужный формат.

Наверно, повторюсь, трудно писать о том, что происходит в данном направлении сейчас, т.к. информационные технологии настолько быстро развиваются, что успеть за ними и уследить, практический невозможно. Поэтому то, что сейчас только внедрили, уже завтра может быть безнадежно устаревшим. Тем не менее, некоторые технологии вчерашнего дня, по ряду причин, до сих пор все еще актуальны. Например, все не как не соберу денег на новый смартфон, да и старый меня вполне устраивает, поэтому я, как и 5 лет назад, продолжаю слушать книги на своем стареньком N-82. Хотя, уже давно пора перейти на железо под управлением андроида, или чего-то подобного. Но по ряду причин все еще не перехожу. Дорого, да и подходящих мне смартфонов, по-видимому, пока не придумали.

Конвертация книг частично рассмотрена в подразделе: «Сохранить книгу в нужном формате», ниже. К тому же тема довольно большая, т.к. форматов много. Если говорить за фанридер. То, в нем есть кнопка «Файл», «Сохранить документ как…» и выбираем нужный формат.

Рис. 33 Настройки в программе файнридер.

Рекомендую сохранять в двух форматах .docx и .pdf (текст под изображением). Не буду долго расписывать почему, зачем, как... Нюансы распознавания. Хотя наверно стоило бы. Но это долго. Если кому надо, Googlите, есть на YouTube не плохие видео «Как распознавать книги файнридером». Или, надеюсь, в будущем появится бесплатная аналогичная программа.

Если имеется уже распознанный текст, возможно, потребуется его переконвертировать в нужный формат. В зависимости от формата, можно воспользоваться стандартными

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Ст. 134 из 343

средствами. Т.е. программами, работающими именно с этим форматом, либо задействовать какие-то специализированные «всеядные»: конвертеры форматов. Например, многие не ухищрённые пользователи думают, что все, что сохранено в .pdf является картинкой. Но на самом деле в данном формате может быть, как картинки, так и текст. Зачастую этот текст оттуда быстрее «вытянуть», чем распознавать фанридером. Делается это акробатом, но, к сожалению, только платной версией: Acrobat Pro. Среди именно конвертеров с pdf файлами работают AVS Document Converter, или разные PDF2Word. Аналогично можно преобразовывать с помощью специальных конверторов файлы формата .chm, .fb2, .epub и другие.

П. с.

Кому интересно узнать больше о самих принципах распознания текстов, в качестве дополнения, могу порекомендовать навскидку пару интересных статей: «Распознать нельзя оставить картинкой, или кое-что о сложных случаях оптического распознавания текста». В ней доступным языком повествуется о простых для человека, но в то же время чрезвычайно сложных проблемах для программы распознания текстов. И подробная статейка о разницы векторных и растровых шрифтов «Векторный и растровый текст». Хотя вторая статья не относится непосредственно к теме распознания, но все же, возможно станет подкреплением и дополнением к подразделу «Код буквы и картинки – книга глазами ЭВМ.»

Пару слов о онлайн сервисах.

Решил влепить сюда небольшой подраздел, по теме распознания книг и конвертирования. Я не сторонник онлайн сервисов, но вдруг кому пригодиться. Или кто-то перед скачиванием программы что бы не тратить время захочет попробовать распознать пару страниц и переконвертировать. Так сказать, испытать свои силы.

Навскидку нашел пару неплохих статей, с обзорами нескольких онлайн сервисов распознания текста. В этой: «Онлайн распознавание текста — ТОП-3 сервиса», в конце есть видео. А в этой: «Онлайн-сервисы для распознавания текста», описано все довольно детально, хотя ссылки на картинки, по-видимому, уже битые. На первом месте, как офлайн, так и онлайн сервис компании файный ридер: FineReader Online. К сожалению, онлайн версии, как этой, так и других программ, аналогично многим сервисам онлайн, ограниченные и урезанные, по сравнению с теми, которые можно запустить с ПК. Поэтому если вам надо пару страничек распознать, попробовать, побаловаться, то все же лучше воспользоваться офлайн и желательно портативной версией. А это крайний случай, для самых ленивых и неумелых. Сервисы сегодня работают, а завтра могут оказаться не рабочими, либо добавят новые ограничения, которые вас неприятно удивят и сведут все ваши труды на нет. Хотя ради справедливости отмечу что мне удалось найти парочку онлайн сервисов, которые превзошли своих офлайн собратьев. Например, сервис по компиляции книг с FB2 в ворд, https://convertio.co/ru/fb2-docx/ с сохранением форматирования, закладок и т.д.. Но это уже другая тема. Раньше именно для конвертации, мне приходилось пользоваться ICE Book Reader (портативной версией). Крутая, навороченная программа, но по сути заточена для прочтения глазами с экрана, а функция конвертера лишь как дополнительная. Поэтому, как я не мучился перебирая все настройки, так и не удалось добиться, что бы она хорошо «вытягивала» текст с FB2, сохраняя всё форматирование, заголовки, картинки. А вот сервис, приведенный мною, выше оказался лучше программы. Конечно в современных дивайсах книги прорабатывают в основном именно в FB2, но, на сколько мне известно, этот формат не предназначен для редактирования и не так гибок, как гигант – ворд. Поэтому рекомендую сводить все книги именно к docx формату. Хотя, можно на всякий случай держать их и в pdf.

Общие моменты.

На том, как сбрасывать книги на мобильный, пока останавливаться не буду. Есть масса способов. Все зависит от дивайса и установленных программ. Я лично для этого использую блютус, чтобы ни расшатывать порты и лишний раз не дергать карту памяти. Хотя, если файлов много, и они большие, то целесообразнее воспользоваться картридером, и вытянуть карту. Вариантов масса. Надеюсь, трудностей не у кого не возникнет. Кроме счастливых

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Ст. 135 из 343

обладателей новых дивайсов с андроидом, в которых появилось нововведение невозможности полноценно расшарить папки через блютус стандартными средствами. Вот вам, очередное доказательство «прогресса» технологий. Там приходится использовать по старинке кабель, или ставить доп. софт расшаривая вайфай.

Перейду непосредственно к программам синтеза речи. Благо они появляются на разных устройствах и работают под различными операционными системами.

Но прежде чем перейти отдельно к операционным системам стоит отметить, что практический во всех программах синтеза речи есть один существенный нюанс. А именно то, что, скорей всего, придётся установить отдельно программу, и отдельно синтезаторы речи.

Покажу на примере Windows, и надеюсь, что подобный хотя бы такой ДОРАБОТАННЫЙ софт появится и на линуксе. Что бы можно было назначать горячие клавиши и тукать на кнопочки, а не писать команды в консоле.

Синтезатор речи (голоса).

Собственно, сам синтезатор речи еще называют «голосовым движком», «голосовым модулем». Аналогия не случайна. Он, как и двигатель в машине, обеспечивает её работу, оставаясь скрытым под капотом. Так же и сам синтезатор не видно. Хотя конечно можно найти его файлы, но он, как правило, не имеет какого-то окна и иногда узнать, что он установлен правильно можно либо зайдя в программу для синтеза речи, либо зайдя в системные настройки и проверив. Иногда примитивный синтезатор речи уже встроен в систему (см. рис. ниже). Но в основном он умеет говорить только на английском и ужасно.

Рис. 34 Стандартное распознание речи в виндовс 7.

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Ст. 136 из 343

Рис. 35 Преобразование текста речи в виндовс 7.

Рис. 36 Настройки произношения в виндовс 7.

Программа синтеза речи.

Программа обеспечивает удобства работы синтезатора. Еще их называют TTS-программы от английского Text-To-Speech (дословно переводится как «текст в речь»). Как правило, такая программа имеет графический интерфейс, т.е. привычное окошко с кнопочками, разные настройки и функции: пауза, чтение с буфера обмена, таймер и многое другое. Программа синтеза речи — это как бы шкурка и одежка для голосового движка.

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Соседние файлы в предмете Информационная технология в печатном деле