Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
РТМ3 весь.doc
Скачиваний:
8
Добавлен:
28.09.2019
Размер:
9.07 Mб
Скачать

02.05. Информационная накачка и информационные морфизмы поиска и размещения пертинентной информации в локальных информационных пространствах мобильной компьютерной техники

Информационная накачка ресурсов собственных микропорталов, блогов и библиотек конечного пользователя может осуществляться как в процессе информационнного поиска пертинентных файлов непосредственно из локальных хранилищ, размещённых на носителях НЕТБУКа, внешнего хоста, репозитария пользователя, на его внешних носителях (внешних жёстких дисках, флэш, СD картах, CDDVD-ROM), так и из ресурсов корпоративных и глобальных сетей, особенно из Интернета (в ближайшие годы, видимо, и из GGG). Здесь в отношении понятий «информационная накачка» и «информационный морфизм» уместно дать некоторые пояснения.

Морфизм представляет собой класс эквивалентности, взаимодействие. Морфизм как теоретическое представление системности информационных средств является яркой составляющей современной синергетической науки. Информационный морфизм – это гомоморфизм свободного моноида в информационном поле, генерируемого из сообщества морфологических, иногда и синтаксических, схожеств и признаков, способных к кластеризации. В теории идеального морфизм - это событие, информационный морфизм (взаимодействие), представляющий протяженный во времени процесс взаимозависимого изменения параметров состояния информационного объекта и информационного пространства. В процессе этого взаимодействия в информационной системе (ИС) объект-источник не всегда теряет (испытывает эмиссию) некоторое количество информации при передаче ее другому объекту, в то время как другой объект-получатель всегда приобретает некое новое добавочное количество информации (происходит его ремиссия). Совокупный объем информации, а также их суммарная (обобщённая) энтропия при этом обмене неизбежно возрастают, а совокупная система расширяется. Процесс этот ассиметричен.

Отсюда информационному пространству присущи следующие свойства:

• наличие информационных морфизмов, которым присуще информационное

межсистемное взаимодействие;

• информационный морфизм возможен только при определенном взаимном

соответствии свойств и качеств системных объектов обмена информацией;

• информационный морфизм приводит к изменению свойств и качеств объектов обмена информацией;

• информационный морфизм приводит к переходу объектов обмена информацией только в свойственные им возможные ("чистые") состояния, что есть проявление эмерджентности морфизма.

(Эти и другие теоретические положения настоящего раздела РТМ отражены в диссертациях составителей РТМ Р.Г. Болбакова, А.Ю. Войтовича, А.А. Миронова, А.Г. Тюрина и др.).

В соответствии с принципом эмерджентности новый носитель знаний возникает как результат действия положительной обратной связи, имеющей место между различными иерархическими уровнями информационного восприятия в процессе обмена информацией. С точки зрения синергетики носитель информации возникает в результате самопроизвольного нарушения существующей симметрии информационного морфизма в точке бифуркации, как следствие синергетического развития информационного объекта. Возникающие носители могут обладать или не обладать устойчивостью по

отношению к информационной среде. При появлении устойчивого носителя может происходить фиксация возникшего типа носителя в случае возможного его использования по отношению к информационной структуре более высокого порядка.

Отсюда вероятностная модель информационного морфизма V между двумя объектами А и В в образовательной информационной среде определяется следующим образом:

,

(1)

где Ci – относительное количество информации вида I[k-(k+1)] в дуплексном информационном пространстве (самый общий случай информационного обмена между объектами A и B);

k – максимально возможное количество уровней у одноветвной вертикали архитектуры семантической сети;

Ea и Eb – относительные (долевые) распределения информации в потоках;

– сложный коэффициент, который определяется как мера энтропийно-семантического соответствия через коэффициент точности информационного обеспечения или коэффициенты полноты, шума, соответствия (в зависимости от специфики поставленных задач).

Коэффициент в первом приближении равен натуральному числу е в степени произведения: ,

где L - коэффициент Лагранжа,

и - характеристические коэффициенты информационных потоков в направлениях от A к B и от B к A в декартовой системе координат.

Однако, рассмотренного определения недостаточно для представления информационных процессов, происходящих с элементами, одновременно взаимодействующими внутри собственного слоя и в межслойном пространстве, в том числе для открытых информационных систем.

В связи с этим, в диссертационной работе Войтовича А.Ю. предложено использовать модификацию формулы (1), заключающуюся в определении нового характеристический коэффициент информационного потока , распространяющегося в произвольном направлении, не совпадающим с плоскостью, на которой описаны внутриуровневые взаимодействия. Тогда,

.

(2)

Вероятностная модель информационного морфизма Vi, будет иметь вид:

.

(3)

Следовательно, математическое описание информационных морфизмов на переходах из слоя в слой в представлении семантической сети Онтонет в виде многоуровневого «сэндвича» Бернерса-Ли, имеет следующую форму записи:

(4)

На основе полученных эмпирических результатов авторами сформулирована гипотеза, отражающая следующее свойство информационного морфизма расслоенных семантических сетей:

«Межуровневые переходы в комплексной модели информационного морфизма в расслоенной архитектуре с прикладными нижними уровнями осуществляют неоднородный вклад в оценку обобщенного морфизма системы (сети)».

Как упоминалось выше, эффективным математическим аппаратом, описывающим проявления свойств информационного морфизма в переходах семантического «сэндвича», явилось математического описание энтропии расслоения.

Обобщение приведенного выше математического описания выглядит следующим образом:

.

(5)

где m – число уровней;

Zn = [0:1] – весовой коэффициент, отражающий передачу свойств объекта при межуровневом информационном взаимодействии в расслоенной системе.

При этом Zn = 0 – незначимый морфизм;

Zn = 1 – значимый морфизм.

Предложенные выше решения предоставляют возможность формализации описания межуровневых взаимодействий в семантических информационных сетях, основывающуюся на модификации обобщенной формулы информационного морфизма информационных объектов. В результате получены обновления методов и семантико-энтропийное регулирование, позволяющие моделировать и проектировать, внедрять и сопровождать в пределах полного жизненного цикла развитые в приближении к уровню WEB 3.0 модификации семантических сетей, ориентированных на извлечение знаний.

Ограничивая процедуры и всю методологию информационного обмена ужатыми технологическими возможностями нетбучной техники неизбежно приходится отказаться от дуплексного обмена информацией, довольствуясь односторонними потоками и расширениями несмотря на то, что обобщённая энтропия информационного пространства пользователя при этом нарастает самым невыгодным образом. Однако, в реальной практике информационной поддержки учебной деятельности многочисленных конечных пользователей редко кто занимается систематическим упорядочением формируемых ресурсов, наоборот, почти все наращивают их с каждым шагом информационного поиска, что однозначно выводит дуплексный информационный обмен за пределы реализуемых морфизмов. Для мобильных технологий на основе массового применения НЕТБУКов это весьма кстати. Тогда, Vi = Ea, то есть необходимость сложного определения коэффициента L пропадает, а односторонний информационный обмен, как результат информационного поиска, превращается в простую информационную накачку.

Опыт разработчиков РТМ показал, что информационная накачка является достаточно эффективным, простым, доступным каждому пользователю средством поиска и восполнения информационных пробелов в индивидуальном информационном образовательном пространстве, формируемом и обслуживаемом с использованием нетбучной техники. Технология информационной накачки представляет собой структурное сопряжение, возникающее в результате рекуррентных информационных морфизмов двух или большего числа информационных систем (информационных пространств). Именно такая технология часто используется для быстрого эффективного контентного наполнения создаваемых новых информационных образовательных порталов, в которые закачиваются модули уже существующих положительно себя зарекомендовавших образовательных порталов, сайтов и библиотек. Наряду с простой информационной накачкой целыми массивами информации пользователям НЕТБУКов предлагается в первую очередь использовать все возможности онтоориентированной дифференцированной информационной накачки по пертинентным признакам. Иными словами, при возникновении очередной потребности в информационной поддержке того или иного понятия, пользователь осуществляет пертинентный поиск сообразно его представлениям (информационному образу) об этом понятии либо в массивах собственных информационных ресурсов, либо в корпортивных сетях и порталах, либо в Интернете, либо в сочетании упомянутых источников. Просмотрев выведенный листинг результатов поиска и оценив эти результаты на пертинентное, а в образовании и науке ещё и на когнитивное соответствие, пользователь обычно размещает отобранный им материал на кратковременное или длительное хранение в составе уже существующих у него информационных контейнеров или создаёт на основе отобранного материала новые информационные консисты (объединение информационных папок в папку выше стоящего инфологического уровня по принципу единства унифицированного интегрированного для них всех атома, точнее Integral Feed Atom RSS). И в первом и во втором случае информационная накачка увеличивает меру обобщённой энтропии систем пользователя, поскольку понятийная база ресурса всё более и более размывается по мере наполнения её информацией, содержащей кроме заведомо пертинентных составляющих в массивах элементарных семантических единиц (ЭСЕ) ещё и составляющие, отвечающие многим другим идентификационным признакам кроме заложенных в процедуру пертинентно направленного поиска.

Необходимо также иметь ввиду, что обобщённая энтропия обладает свойством ИЕРАРХИЧЕСКОЙ АДДИТИВНОСТИ. Это очень важно с тех позиций, что семантико-энтропийная характеристика, как генеральная характеристика совокупных морфизмов ИС, благоприятна только при соблюдении трех взаимосвязанных условий:

  • обеспечение принципа ЭРГОДИЧНОСТИ (технической оцениваемости, повторяемости и предсказуемости) функционирования ИС (при монотонном без разрывов второго рода изменении энтропии, что обеспечивают технологии информационной накачки, очищенной от проникновения вирусов и вообще exe файлов);

  • обеспечение принципа СООТВЕТСТВИЯ на основе достижения требуемых пертинентности и когнитивности (в образовании и науке);

  • обеспечение принципа АДДИТИВНОСТИ (желательно на основе функционирования ИС исключительно как транзакционной).

Взаимодействие, реализуемое средствами транзакций, отсечение всех вредоносных воздействий и атак, шлама, засоряющих окон и некоторые другие превентивные меры позволяют считать аддитивность хотя бы условной, эргодичность достигнутой, а выполняемую дифференцируемую онтоориентированную накачку в информационной среде НЕТБУКа конечного пользователя эффективной.

Поясним всё упомянутое выше конкретным примером. Выполняя курсовую работу по теории информационных процессов и систем пользователь решил ознакомиться с особенностями и моделями продукционно-фреймового представления знаний, приведёнными в очень интересном, кстати, автореферате кандидатской диссертации Д.В. Сошникова (2003 год). Вместе с тем пользователь, как это чаще всего бывает, не помнит ф.и.о. автора диссертации, не знает её полного названия и понятие «продукционно-фреймовое представление знаний» интерпретирует для поиска совсем неточно и неполно. При таких начальных условиях эффективный поиск по названию и расширению файла невозможен. Приходится прибегать к механизмам дифференцированного онтоориентированного поиска по слэнгам, формируя поисковый образ из возможно наименьшего числа ЭСЕ. Заложив в этот образ всего два слова «диссертация» и «фреймы» можно получить листинг релевантных сообщений как из собственных ресурсов, так и из Интернета или корпоративных образовательных сетей. Обобщённая энтропия поиска в приведённом примере высока: так, Яндекс Интернета по состоянию на январь 2011 года откликается более, чем тысячей формально релевантных сообщений, найти среди которых искомые пертинентные файлы затруднительно. В локальных ресурсах эта задача может решаться существенно легче. Допустим далее, что пользователь помнит ещё и фамилию (только фамилию) автора искомой диссертации, то есть к словам «диссертация фреймы» добавляет третье поисковое слово «Сошников». Тогда даже в Интернете число сообщений ограничивается достаточно умеренным списком из 43 позиций, как минимум две из которых оказываются вполне пертинентными и когнитивными, предоставляя файл «Сошников Дмитрий Валерьевич «Методы и средства построения распределенных интеллектуальных систем на основе продукционно-фреймового представления знаний»: диссертация на соискание учёной степени кандидата физико-математических наук по специальности 05.13.11»».

Приведённый пример вполне типичен, как типичны и действия пользователя после нахождения искомого пертинентного файла – на его основе, отсекая всё остальное, явно не отвечающее признакам пертинентности, создать и сразу же несколько расширить онтоориентированный консист по схеме расширения предметной области сопутствующими публикациями уважаемого Д.В. Сошникова, либо из диссертаций (публикаций) иных авторов по образу «продукционно-фреймовое представление знаний», либо как-нибудь ещё в зависимости от того, какую задачу информационного обеспечения ставит перед собой пользователь. При этом в условиях технологической ограниченности нетбучной техники пользователь вынужден ежечасно оглядываться на факторы возможной перегрузки ИС по производительности и информационной ёмкости. Правда, неуклонно соблюдая принципы достижения когнитивности и пертинентности формирования информационного ресурса НЕТБУКа, и при выполнении условий эргодичности и аддитивности, а также сохраняя все заложенные изначально признаки меры системности (коэффициент эмерджентности ИС), можно прийти к благоприятному результату минимизации обобщённой энтропии информационного ресурса формируемого консиста и некоторого снижения обобщённой энтропии функционирования системы в целом. Для контроля качества функционирования ИС мобильной техники по этим показателям одним из составителей РТМ диссертантом А.Г. Тюриным разработана, апробирована и размещена в электронной версии РТМ (в четвёртой его части) специальная тест-программа. Эта программа есть ни что иное, как счётчик вносимых в ИС файлов и пертинентных файлов из их числа. Причём подсчёт ведётся как по системе в целом, по любой из назначенных пользователем подсистем, так и по отдельно взятому онтоориентированному информационному консисту (где атом: «фрейм»), например, «теория фреймов в общей теории информационных процессов и систем» (Яндекс слэнговым поиском выдаёт на этот образ несколько сотен документов). На выходе программы некий численный индекс, отражающий динамику изменения отношения пертинентных файлов к общему числу; он же косвенно свидетельствует об уменьшении обобщённой энтропии по мере желательного приближения индекса к единице (от нуля). Индекс также является удобным средством, позволяющим оценить целесообразность выделения того или иного понятия в отдельный тематический косист и формирвания на этой основе метаописаний и слов тезауруса в многоуровневом портальном строительстве.