Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Болгарчук Р. - Книга 3.0 Слушайте! 2017.pdf
Скачиваний:
66
Добавлен:
01.12.2019
Размер:
14.79 Mб
Скачать

Ст. 285 из 343

Пока только Звуки и вибрация при нажатии на экран. Или вот другая технология: «Смартфон без динамика», правда, телефон все токи подносят к уху, а я предлагаю разработать софт, который бы позволял его даже не вытягивать с кармана.

Странно, что полезных программ для вибратора телефона очень мало. Его можно было бы использовать в связке с акселерометром, чтобы не только получать, но и определенными движениями передавать информацию, в частности какие-то заданные команды телефону.

Автоматизация.

Выше я очень красочно описал, что и как можно сделать, но практический не останавливался на том, кто это будет делать. Как у нас часто привыкли, монотонный рутинный труд из-под палки одни люди, заставят делать других людей. Но я против таких решений. Думаю, уже сейчас понятно, что надо делать упор на автоматизации и роботизации. Т.е. надеюсь, что в будущем большую часть функций адаптации к просмотру, прослушиванию, разные варианты и представления информации будут возложены на программы. Именно они должны будут все это делать. Но и люди не будут седеть, сложа руки. Некоторые креативные решения будут все токи генерировать все еще люди. К тому же многие футурологи часто забывают о том, что сами программы автоматизации надо еще создать. Да, уже появляются и есть, много примитивных наработок, но они, пока что не значительны. Поэтому, по крайней мере, первые вразумительные программы для автоматического анализа и редактирования текстов придётся создать людям. И это не простая задача.

Голос в текст.

Уже появляется масса программ, которые не только могут озвучивать тексты, но и наоборот преобразовывать звук в текст. Хотя, технический, это уже на много сложнее. Особенно меня привлекают технологии способные преобразовывать продолжительные речи, а не короткие фразы.

Надеюсь, появятся доступные, так называемые speech recognition continuous, работающие с русским языком. Вот список с рейтингом подобных программ: Dragon NaturallySpeaking,

Braina, Speechnotes, LilySpeech, Speechlogger, Speechlogger, Speech Assistant

Данные программы дали бы возможность не только писать книги, рассказывая их компьютеру, но и преобразовывать лекции, обычные диалоги в осмысленный текст который в дальнейшем можно прорабатывать, по ранее описанным мною схемам. Поиск, редактирование, перевод и многое другое.

Мозг.

Таким образом, у нас уже практический есть уши, глаза и язык машины. Т.е. ЭВМ уже могут видеть и понимать кое-что с увиденного, слышать и понимать с услышанного и говорить. Теперь мы достигли до самого сокровенного -- научить компьютер думать. Объединить все эти навыки в согласованную систему. Успехи есть и в этом направлении, правда не большие.

Например, вот видео еще 2014 года: «Презентация ЦРТ на Call Center Optimization Summit 2014», в котором, наглядно показано использование не только синтезаторов речи, но и целого комплекса программ, по восприятию и анализу аудиоинформации. Возможно, на базе подобных технологий возникнет, что-то, показанное в фильма «Она». По данной теме подробно писал в своей статье: «Отзыв и рассуждения о фильме «Она» 2013». Особенно, как и в статье, хочу сделать акцент на том, что не вижу реальных причин и непреодолимых трудностей, чтобы не создать такую операционную систему уже сегодня. Впрочем, голосовые помощники уже полным ходом внедряются в разные операционные системы. Какие у них возможности как их можно использовать уже сейчас, не плохо показано в видео: Ассистент Дуся (старая версия). А вот пару видео «соревнований» между помощниками: «Смертельная схватка ассистентов: Siri, Cortana, Алиса и Google Now». А еще целая лекция с той же темы: «Поговорим с Windows: Cortana и не только». Но продуманной нейросети таким системам пока недостает…

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

книга про дизайн

Ст. 286 из 343

Книги, написанные роботом.

Помимо пустой болтовни и примитивной помощи, программы уже сейчас самостоятельно могут писать книги. Вот: «В Японии книга, написанная роботом, вышла в финал литературного конкурса». И вот еще, нашел навскидку, обсуждение на форуме «Книги, написанные компьютером, — уже в продаже».

Но к сожалению, пока что это разные мыльные романы. Как говориться дурное дело не хитрое. Будем ждать пока программы поумнеют и начнут писать научпок, а затем справочную, учебную и техническую литературу. Вот это действительно будет прорыв. Пока что к сожалению таких книг, не встречал, но не вижу причин что бы они не появились уже сегодня. Просто надо создать хорошие нейронные сети и дать им проработать

Рис. 98. 50 оттенков серого – большой массив данных, потом поставить задачу, и на выходе можно получить хорошую книгу.

Возможно это будет не сразу. Вероятно, она потребует корректировки и это будет совместный труд человека и машины, а точнее человека и программиста, создавшего программу создания книг. Как будь то программист не человек (может заподозрить читатель). Как это не странно, но по-видимому многие так и думают веря в то, что роботы и программы ИЗНАЧАЛЬНО создают себя сами. Надеюсь в будущем такие программы вытеснят алчных правоблабладателей. О бумажных книгах забудут вовсе, как о каменных табличках, а цифровые станут настолько популярны что уже не кому не придёт в голову зарабатывать деньги на написании книг. Книги будут писать программы, а сами писатели переквалифицируются в программистов создающих такие программы. Тем не менее, вероятнее всего именно когнитивные навыки человека, неординарные мысли, суждения, еще долго будут актуальными. С ними-то, помимо аналитики и собственных ресурсов, будут трудиться роботы-писатели.

Пару слов о перспективах и роли нейронных сетей.

Начну с ссылки на видео: «Введение в архитектуры нейронных сетей / Григорий Сапунов (Intento)». Очень обширная и интересная лекция. Увы, думаю, далеко не всем она будет понятна. Но все же, даже не ухищрённому знаниями в ИТ человеку, может стать ясно, насколько широки перспективы программирования, работы программ с механизмами самообучения и нейросетями, в частности. Тема настолько огромна, что в лекции пришлось пройтись поверхностно и галопом... Жутко интересно было бы остановиться на мультимодальном обучении, которое только вскользь затронули на 30й минуте видео, фреймворках, библиотеках для нейросетей, перспективах и проблемах использования их на домашнем ПК и многом другом. Благо на Ютубе есть масса подобного материала. Единственное хочу предупредить что, надо смотреть их от простого к сложному, т.к. многих может отпугнуть материал среднего и вышесреднего уровня. Поэтому, начать можно с чегото типа такого: «Нейронные сети за 30 минут: от теории до практики», а уже потом плавно перейти на лекции: «Лекция 1. Нейронные сети. Теоретические результаты».

Хотя, увы, мощности домашних ПК, пока не позволяют серьезно заниматься подобными разработками. Тем не менее, будем надеяться на лучшее. Думаю, нейросети сыграют свою не последнюю роль в становлении искусственного интеллекта, с которым мы сможем общаться

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Ст. 287 из 343

на равных, и который в будущем превзойдёт нас. Уже сейчас порекомендовал бы разработчикам делать упор на направлениях барона Мюнхгаузена. Возможно это прозвучит комично и сюрреалистично, но заявляю это без доли иронии. Просто потому что не знаю, как еще можно назвать данную тактику. На ум лишь приходит Мюнхгаузен вытаскивающий себя за косичку с болота. Но что бы это сработало, косичку надо перебросить через крепкий сук рациональности. Тогда действительно можно вытянуть сильный искусственный интеллект из небытия. Возможно не маловажную роль в этом сыграют нейросети создающие себя сами. Уже сейчас появляются такие нейросети которые помогают обучаться другим нейросетям. Вот в данном направлении и надо развиваться. Так же, с помощью них, можно было бы первым делом перевести именно литературу по тем же нейросетям. Это та же тактика вытаскивания самого себя. Популяризация литературы и др. материалов замкнет круг развития, идущего по нарастающей. Можно поставить перед ними цель создания более доступных и продуктивных машин, которые бы стояли у каждого. Созданию операционной системы с элементами самообучения основанного в т. ч. на нейросетях. Обмене опыта обучения между такими системами и бесплатном распространении наиболее эффективных и выполняющих запросы именно грамотных и прихотливых пользователей. Ну и естественно, нейросети уже сейчас могли бы проработать в первую очередь не картинки с котиками и собачками, а массу книг, которые весят за частую столько же сколько и картинки, но имеют на много больше полезной информации. Единственное почему это не происходит, так это скорей всего низкий уровень программистов. А именно как раз-таки тот уровень калейдоскопичного мышления, при котором не видят всей картины и не понимают перспективных направлений развития. Попались первыми под руку котики, начали работать с котиками. За командовали сделать распознавание дорожных знаков – сделали. А вот сделать упор на саморазвитие, выбрать нужную стратегию и тактику в целом, увы, некому. Я бы предпочел нейронную сеть способную самостоятельно прорабатывать и писать грамотные книги, вместо программ обыгрывающих гроссмейстеров в го и шахматы. Конечно, это сложнее, но пока только занимаются автоматическим созданием мыльных романов, вместо создания книг по нейросетям самими же нейросетями на основе глубокого их анализа, самостоятельной проработке материала по нейросетями нейросетями с самообучением, включением все новых и новых алгоритмов на основе того же проработанного материала. Уделяют мало внимания поисков новых принципов и подходов для более продуктивного взаимодействия человека и нейросетей, как со стороны нейросетей, так и со стороны людей. Проработкой и внедрением смежных технологий, позволяющих создать сильный искусственный интеллект. И т.д. и т.п.

Может в далёком будущем, в отличии от неблагодарных и тупых обезьян, хоть искусственный интеллект, анализируя хроники, оценит вышеописанные советы и скажет подобным мне спасибо. Посмертно…

П. с. Еще пару слов о управлении ПК голосом.

Решил в конце прилепить свой расширенный и дополненный комментарий к видео и статье Oleg Lav «VoxCommando - общение с компьютером и управление голосом».

Прежде чем перейти к самому комментарию хочется заметить, что мне не раз приходилось встречать видео Олега, (полагаю это его настоящее имя). Они характеризуются не только необычностью, оригинальностью и рассмотрением глубоких тонкостей работы с программами, но и порой неординарным юмором. Как правило, для озвучки своих видео Oleg Lav использует голосовые движки, которым в этой книге уделено так же немало внимания. Движки довольно качественные, но эстетам, вникающим в фон, а не содержание, такие голоса могут резать слух. Но про это уже довольно подробно расписывал. Кто хочет оценить работу синтезаторов голоса, еще и в ипостаси дикторов для видео рекомендую видео Олега. Его вымышленные герои, не только могут обучить чему-то полезному, но и повеселить. Я и сам пару раз для разнообразия использовал для озвучки своих видео голосовые движки, и замечу, что это бывает порой очень удобно. Уж лучше такая озвучка, чем шипение, треск микрофона

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Ст. 288 из 343

и беканье меканье которое на ютубе встречается в изрядном количестве на каналах разных дилетантов.

Теперь перейдем непосредственно к возможности управление компьютером с помощью голоса и моему комментарию к этому видео.

Это новая веха в развитии компьютерных программ. Жаль только, что она все не как не настанет. Я такими программками баловался еще лет 10 назад. Но их надо было обучать, что бы они привыкли к голосу. Часто они путали команды, особенно если команд много. Теперь уже появились онлайн сервисы. Такие сервисы понимают произносимое, в основном, с первого раза. Т.е. на много лучше древних офлайн программок. Но, как правило, функционал данных сервисов ограничен и предназначен для баловства в интернете: проложить маршрут, посмотреть погоду, найти песню, ну или тупо ни о чем поговорить с железным другом или подругой. Теперь же надеюсь, что всё-таки эти программы станут офлайн и портативными. Т.к. интернет есть до сих пор далеко не везде, несмотря на то, что его бесплатное появление пророчат вот-вот, каждый год, уже как минимум лет 5 подряд. Но все нет и нет. А портативная программа, которую можно было бы кинуть на флеху, запустить на любом компе и просить его сделать то или иное действие, это было бы супер. Главное, чтобы команды комп не путал: нормально распознавал вашу речь. Перспектив у такого направления выше крыши. С помощью такого разговора, можно было бы даже программы создавать, на основе алгоритма поочередно повторяющихся команд. Говорить с компьютером «на ты», на привычном вам языке, могли бы люди совершенно незнакомые с программированием. И для этого не надо учить сложные коды на английском или, того хуже каком-то птичьем, машинном языке. Например, сколько раз мне приходилось выполнять рутинные действия, которые можно было бы делегировать ПК и такому помощнику. Что бы он сам, к примеру, копировал что-то, переключался между приложениями и вставлял в новое поле, искал, удалял дубликаты фото, чистил, синхронизировал и многое другое. Не надо было бы лезть в консоль или запускать тоталкомандер. Просто можно было бы сказать – «открой мои фотографии», выдели все с 25.12.2017 по 5 января 2018 и переименуй их все, дописав в имя фотографии его дату и фразу «новый год»». Но пока про это говорить наверно рано. Хотя уже можно было бы записать свой голос с последовательными более простыми рутинными командами и проигрывать его. Программа сама бы делала то, что произноситься. Например, я имею привычку копировать статьи вместе с гиперссылками, чтобы потом, при необходимости, можно было бы найти их. Это можно было бы поручить программам. Они бы копировали сам текст, а потом переходили в адресную строку, копировали ссылку и вставляли его под текстом. Это уже сейчас можно сделать, записав в автокликере горячие клавиши. Например: Alt-D , Ctrl +C, Alt+Tab, (стрелка вниз) , Enter, Ctrl+V. Данная не хитрая комбинация переходит в адресную строку, копирует ссылку, переходит в документ (если он открыт и это окно было активно перед этим) и вставляет ссылку ниже текста. Этой всей комбинации можно было бы присвоить голосовую команду «добавь ссылку». И компьютер сам бы это все делал без лишних телодвижений. Особенно это удобно, если вам таких ссылок, или подобных действий надо сделать пару тысяч за день. Так же можно было бы вовсе отказаться от клавиатуры, например, произнеся команду запуска голосового блокнота, в который можно надиктовывать текст. К сожалению, пока он, как и подобные, сервисы только онлайн. Впрочем, странно, что уже эта программа, раз воспринимает речь, не может записывать надиктованный текст. Или переводить речь в буквы, нужный функционал уже есть. А если объединить этот функционал с органайзерами, напоминалками то цены бы такой системе не было. Может через лет 50 таки докрутят, и появится такая система... Но и за это уже спасибо. Буду пробовать, если время найду. Или ждать пока появится для подобных программ свой Гульельмо Маркони, собравший пару деталек в коробку и получивший радио. Увы, пока такого Маркони для подобных программ нет. А ведь уже давно пора объединить вместе голосовые команды, синтезаторы речи, программы для перевода речи в текст (будь то напрямую с микрофона, или с записи, с расстановкой знаков препинания, а не как сейчас…) и добавить им какой-то хороший аналитический движок типа Картаны, Яндекс строки, Алисы, Siri и т.п... А также, естественно,

03.12.2017

Книга 3.0 Слушайте!

Болгарчук Р.

Соседние файлы в предмете Информационная технология в печатном деле