!Экзамен зачет 25-26 год / 67369870
.pdfобобщать информацию об объекте исследований, полученную из разных источников с применением разных технологий.
Об актуальности конкурентной разведки на основе ин- тернет-ресурсов говорят многочисленные публикации, тре-
нинги, конференции. Сегодня задачи конкурентной разведки стимулируют развитие систем управления знаниями, глубинного анализа данных и текстов, с другой стороны наиболее развитые из этих систем в явном виде содержат аналитические блоки, специально ориентированные на задачи конкурентной разведки. Поэтому у пользователей имеется широкий выбор средств автоматизации аналитической деятельности. Причем уровни функциональности таких систем, может быть очень разнообразным – от простых информационно-
поисковых программ, необходимых на этапе становления систем конкурентной разведки, до дорогих и ресурсоемких систем управления знаниями и глубинного анализа данных и текстов.
Для эффективного анализа современных информационных процессов на основе мониторинга информационных потоков из глобальных компьютерных сетей должны применяться современные методы, базирующиеся на нелинейном анализе, многие из которых нашли успешное применение в естественных науках. Современные подходы позволяют применять для анализа и моделирования даже общественных и информационных систем методы, апробированные в первую очередь в естественных науках. Анализ информационных потоков выступает фундаментом таких направлений как моделирование, проектирование и прогнозирование.
В то же время, приведенные модели и методы пригодны для описания общих тенденций динамики информационных процессов, однако, проблема прогнозирования остается открытой. По-видимому, более реалистичные модели могут быть
получены с учетом дополнительного набора факторов, большинство которых не воспроизводятся во времени. Вместе с тем, структура правил, лежащих в основе функционирования большинства из доступных моделей, позволяет вносить соответствующие коррективы, например, искусственно моделировать случайные отклонения. Отметим, что воспроизведение результатов во времени является серьезной проблемой при моделировании информационных процессов, составляет ос-
321
нову научной методологии. В настоящее время только ретроспективный анализ уже реализованных информационных операций остается относительно надежным способом их верификации.
Внастоящее время уже очевидно, что реальный прорыв
вобласти интенсификации информационно-аналитической
работы, как и в науке, возможен лишь в результате агрегирования различных направлений.
322
Краткий глоссарий
Автоматическое реферирование [Automatic text summarization] – автоматическое формирование краткого
изложения исходного текстового материала либо путем выделения фрагментов информационного наполнения и последующего их соединения, либо методом генерации текста на основании выявления знаний из оригинала.
Авторское право [Copyright] – совокупность правовых
норм, регулирующих отношения, возникающие в связи с созданием, использованием (изданием, исполнением, показом и т. д.) произведений науки, литературы или искусства – результатов творческой деятельности людей. Программы для компьютеров и базы данных также охраняются авторским
правом.
Анализ социальных сетей [Social Networks Analysis, SNA] – методология анализа социальных сетей. Предметом
анализа в SNA, в отличие от большинства традиционных социологических исследований, являются не атрибуты отдельных личностей, а структура их взаимосвязей в рамках того или иного сообщества (рабочей группы). В рамках анализа социальных сетей рассматриваются социальные отношения с точки зрения теории сетей, состоящих из узлов – личностей,
участников сети и связей – отношений между ними.
Антимонопольная деятельность [Antitrust Activities] –
комплекс мер, направленных на ограничение деятельности монополий, а также создание соответствующего законодательства.
База данных [Database] – совокупность данных, органи-
зованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, независимая от прикладных программ. Является информаци-
онной моделью предметной области.
База данных аналитическая [Analytical Database] – ба-
за данных, которая содержит информацию, получаемую из других баз данных в форме итоговой информации, представляет наибольший интерес для пользователя или группы пользователей.
323
База данных полнотекстовая [Full-Text Database] –
база данных, в которой хранятся записи полнотекстовых до-
кументов или их частей.
База данных фактографическая [Factographic Database] – база данных, содержащая фактографические
данные – информацию, относящуюся непосредственно к пре-
дметной области.
Бенчмаркинг [Benchmarking] - инструмент анализа кон-
курента. Процесс определения, понимания и адаптации имеющихся примеров эффективного функционирования компании с целью получения информации, которая помогла бы предпринять шаги, направленные на улучшение деятельности компании. В равной степени включает в себя два процесса: оценивание и сопоставление. Одно из направлений стратегически ориентированных маркетинговых исследований.
Бизнес-процесс [Business Process] – система последовате-
льных, целенаправленных и регламентированных видов деятельности, в которой посредством управляющего воздействия и при поддержке определенных ресурсов входы процесса преобразуются в выходы, представляющие ценность для пот-
ребителей.
Бизнес-разведка [Business Intelligence, BI] – 1) сбор и об-
работка данных из разных источников для выработки управленческих решений в целях повышения конкурентоспособности коммерческой организации; 2) структурное подразделе-
ние предприятия, выполняющее эти функции.
Блог [Blog, Web Log] – сетевой дневник одного или неско-
льких авторов, состоящий из записей в обратном хронологическом порядке. С помощью сервиса блогов можно создать свой онлайн-дневник, читать и комментировать дневники
других пользователей, принимать участие в сообществах по
определенным тематикам, создавать свои сообщества. Блогосфера [Blogosphere] – совокупность (коллекция) всех
блогов в сети Интернет; общее название для совокупности
блогов.
Большие данные [Big Data] – серия подходов, инструмен-
тов и методов обработки данных больших объемов и значительного многообразия для получения человеко-читаемых ре-
зультатов, эффективных в условиях их непрерывного прироста, распределения по многочисленным узлам вычислительной
324
сети. В качестве определяющих характеристик для больших данных отмечают «три V»: объем, в смысле величины физического объема, скорость в смыслах как скорости прироста, так и необходимости высокоскоростной обработки и получения результатов, многообразие, в смысле возможности одновременной обработки различных типов структурированных и
полуструктурированных данных.
Веб-аналитика [Web Analytic] – измерение, сбор, анализ,
представление и интерпретация информации о посетителях веб–сайтов в целях их улучшения и оптимизации. Основная задача веб-аналитики – мониторинг работы веб-сайтов, на основании которого определяется веб-аудитория и изучается поведение веб-посетителей для принятия решений по развитию и расширению функциональных возможностей веб-
ресурса.
Веб-пространство [Web Space] - cовокупность сайтов в Интернете (гипертекстовое пространство Интернета, www-
пространство).
Веб-сайт [Website] – набор веб-страниц, составляющих
единое целое (посвященных одной тематике либо принадлежащих одному и тому же автору), как правило, размещенных на одном и том же сервере, имеющих одно и то же доменное имя и связанных между собой перекрестными ссылками. Для прямого доступа клиентов к веб-сайтам на серверах разрабо-
тан протокол HTTP.
Веб-форум [Web-Forum] – класс веб-приложений для организации общения посетителей, веб-сайт, предназначенный
для проведения онлайн-дискуссий.
Виртуальная служба знакомств [Online Dating Service]
– интернет-сервис, предоставляющий пользователям Интер-
нета услуги по виртуальному общению с другими пользовате-
лями, аналог реальных cлужб знакомств.
Визуализация [Visualization] – комплекс методов пред-
ставления результатов анализа данных в наиболее удобной для восприятия и интерпретации форме. Может использоваться для мониторинга процесса построения и работы различных аналитических моделей, проверки гипотез и других
целей, связанных с проведением анализа.
Входная степень узла [In-Degree] – количество ребер графа, которые входят в узел.
325
Выходная степень узла [Out-Degree] – количество ребер
графа, которые выходят из узла.
Геосоциальная сеть [Geosocial Networking] – вид социа-
льных сетей, в которых используются геокодирование. Пользователи оставляют данные о своем местонахождении, что позволяет объединять и координировать их действия на основании того, какие люди присутствуют в тех или иных мес-
тах, или какие события происходят в этих местах.
Глубинный анализ данных [Data Mining] – технология
анализа данных в базах или хранилищах данных, основанная на статистических методах и служащая для выявления заранее неизвестных закономерностей, а также для поддержки
принятия стратегически важных решений.
Глубинный анализ текстов [Text Mining] – технология
извлечения информации из текстовых данных на основе обнаружения в них закономерностей. Как правило, включает этапы структурирования исходного текста (обычно путем синтаксического анализа, добавления одних лингвистических структур и удаления других с последующей вставкой результатов в базу данных), поиска закономерностей в данных,
оценивания и интерпретации результатов.
Глубинный веб [Invisible Web, Deep Web, Hidden Web] –
часть веб-пространства, не индексируемую роботами поиско-
вых систем. Информация, будучи недоступной для поиска, находится «в глубине» (англ. – Deep). Состоит из веб-страниц,
динамически генерируемых по запросам к онлайн базам данных.
Граф связей [Communication Graph] – в социальных сетях
– граф, предназначенный для идентификации связей между их участниками. С помощью графа можно визуализировать эти связи. Граф связей строится благодаря обмену контента-
ми между людьми.
Дайджест [Digest] – информационный продукт (издание,
статья, подборка), содержащий краткие аннотации и основные положения статей или в котором сжато передается содержание самых интересных публикаций за определенный
период.
Дескриптор [(от лат. Descriptio – описание); Descriptor] –
лексическая единица (слово, словосочетание, код) информа- ционно-поискового языка, служащая для выражения основ-
326
ного смыслового содержания документов (текста). Используется для координатного индексирования документов и инфор-
мационных запросов с целью последующего поиска.
Диаметр графа [Graph Diameter] – максимальное из
расстояний между парами его вершин. Расстояние между вершинами определяется как наименьшее число ребер, которые необходимо пройти, чтобы добраться из одной вершины
в другую.
Живучесть системы [System Survivability] – способность
системы выполнять установленный минимальный объем своих функций при внешних воздействиях, не предусмотренных условиями нормальной эксплуатации, осуществлять выбор оптимального режима функционирования за счет собственных внутренних ресурсов, перестройки структуры, изменения
функций отдельных подсистем и их поведения.
Извлечение знаний [Knowledge Extraction] – процесс по-
лучения из данных знаний в виде зависимостей, правил, моделей. Этапы: консолидация, очистка, трансформация, моде-
лирование и интерпретация полученных результатов.
Извлечение (экстрагирование) информации [Information Extraction] – разновидность информационного поиска,
при которой из электронных документов выделяется некая структурированная информация, т.е. катюгоризированные, семантически значимые данные по какой-либо проблеме или
вопросу.
Извлечение фактов, понятий (Feature Extraction) –
технология, обеспечивающая получение информации в структурированном виде. Включает три основных метода: Entity Extraction – извлечение слов или словосочетаний, важных для
описания содержания текста; Feature Association Extraction –
выявление связей между извлеченными понятиями; Event and Fact Extraction – извлечение сущностей, распознавание фак-
тов и событий.
Имидж компании [Corporate Image] – устойчивые пред-
ставление, которое компания создает о себе с помощью рекламы, формируя благоприятное представление у целевой аудитории. Это устойчивое представление потребителей, клиентов, партнеров и общественности о престиже компании, качестве еѐ товаров и услуг, репутации руководителей.
327
Имитационное моделирование (Simulation Modeling) –
метод исследования, при котором исследуемая система замещается моделью, с достаточной точностью описывающей реальную систему. Эту модель используют для экспериментов с целью получить информацию о реальной системе. Имитационное моделирование – частный случай математического моделирования. Существует класс объектов, для которых по разным причинам не разработаны аналитические модели или методы решения относительно полученной модели. В этом случае математическая модель замещается имитатором или имитационной моделью – логико-математическим описанием
объекта.
Интернет [Internet] – глобальная информационная сеть,
части которой логически связаны единым адресным пространством, основанным на стеке протоколов TCP/IP, их последующих расширений или других IP-совместимых протоко-
лов. Обеспечивает, использует или делает доступным, публично или частным образом, коммуникационный сервис высокого уровня. Состоит из множества взаимосвязанных компью-
терных сетей.
Интернет-разведка [Internet Intelligence] – сегмент кон-
курентной разведки, охватывающий процедуры сбора и обработки информации, проводимые с целью поддержки принятия управленческих решений, повышения конкурентоспособности коммерческих организаций исключительно из открытых источников из компьютерных сетей, большинство из
которых являются надстроенными над сетью Интернет.
Интернет-чистильщики [Internet-Cleaners] – специали-
сты или службы, которые могут удалить из информационных ресурсов сети Интернет данные (как правило, негативную
информацию о заказчике).
Информационная безопасность [Information Security] –
состояние информации, информационных ресурсов и информационных систем, при котором с требуемой вероятностью обеспечивается защита информации (данных) от утечки, хищения, утраты, несанкционированного уничтожения, искажения, модификации (подделки), копирования, блокирования и т.п. Имеет три основные составляющие: конфиденциальность, целостность и доступность.
328
Информационно-аналитическая деятельность [Inf- ormational-Analytical Activity] – отрасль человеческой деятель-
ности, призванная обеспечить информационные потребности общества с помощью аналитических и информационных технологий за счет обработки входной информации и получения
качественно нового знания.
Информационно-аналитическая система, ИАС [Infor- mation-Analytical System, IAS] – класс информационных сис-
тем, предназначенных для аналитической обработки данных, а не для автоматизации повседневной деятельности организации. Объединяет, анализирует и хранит информацию, извлекаемую как из баз данных организации, так и из внешних источников. Входящие в состав ИАС хранилища данных обеспечивают преобразование больших объемов детализированных данных в обобщенную информацию, пригодную для
принятия решений.
Информационно-поисковая система, ИПС [information retrieval system, IRS] – система, предназначенная для обеспе-
чения поиска и отображения документов, представленных в базах данных. Ядро ИПС составляет поисковый механизм – программный модуль, который осуществляет поиск по запросу. ИПС, интегрированные с веб-технологиями, являются ос-
новой построения информационно-поисковых веб-серверов.
Информационное воздействие [Informational Influence]
– возбуждение (торможение) в управляемой системе таких процессов, которые стимулируют желательный для управляющей стороны выбор. Этот способ воздействия на субъекта не предполагает, например, прямого выведения из строя части элементов его системы, но представляет собой передачу ему такой информации, которая натолкнет его на выбор определенного решения, при котором эти элементы потеряют
свою эффективность.
Информационные операции [Information Operations] –
информационное воздействие на массовое сознание (как на враждебное, так и на дружеское), воздействие на информацию, доступную конкуренту и необходимую ему для принятия решений, а также на информационно-аналитические систе-
мы (ИАС) конкурента, в том числе действия, направленные на физическое поражение ИАС, вывод из строя средств компью- терно-телекоммуникационной инфраструктуры.
329
Информационные ресурсы [Information Resources] –
отдельные документы и отдельные массивы документов, документы и массивы документов в информационных системах, зафиксированные на соответствующих носителях инфо-
рмации, а также языковые средства, применяемые для описания конкретной предметной области и для доступа к дан-
ным и знаниям.
Информационные объекты, ИО [Informational Objects] –
объекты, содержащие (несущие) информацию. Могут описываться непосредственно или в виде алгоритма их порожде-
ния.
Информационный портрет [Informational Portrait] – до-
кумент, который характеризует в компактной форме основное содержание текста - описанные в нем предметы, лица,
ситуации и т.п.
Капча [Captcha] – нечеткое графическое изображение
букв и цифр, которые требуется ввести с клавиатуры в опре-
деленное поле.
Классификация [Classification] – система распределения
объектов по классам в соответствии с определенным признаком (основание классификации). Объекты необходимо классифицировать для выявления общих свойств информационногого объекта, который определяется информационными параметрами (реквизиты). При классификации нужно соблюдать требования: полнота охвата; однозначность реквизитов;
возможность включения новых объектов.
Кластерный анализ [Cluster Analysis] – многомерная
статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов и затем упорядочивающая объекты в сравнительно однородные группы (кластеры).
Клики [Cliques] – подгруппы или кластеры, в которых уз-
лы связаны между собой сильнее, чем с членами других клик.
Коммерческая тайна [Trade Secret] –сведения конфиде-
нциального характера из любой сферы деятельности государственного или частного предприятия, разглашение которых может нанести материальный или моральный ущерб ее владе-
льцам или пользователям (юридическим лицам).
Конкурентная разведка [Competitive Intelligence] –
спланированные действия по систематическому сбору и ана-
330
