Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 800628

.pdf
Скачиваний:
6
Добавлен:
01.05.2022
Размер:
9.6 Mб
Скачать

УДК 004.93,11

ОБ ОЦЕНКЕ ЗНАЧИМОСТИ ПАРАМЕТРОВ КЛАВИАТУРНОГО ПОЧЕРКА ПОЛЬЗОВАТЕЛЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ

Ю.И. Еременко, Ю.С. Олюнина

СТИ НИТУ «МИСиС»

В статье производится оценка значимости параметров клавиатурного почерка (КП), необходимых для проведения процедуры идентификации пользователя. Для ее решения предложено использование метода главных компонент. В пакете Statistica проведен анализ образцов клавиатурного почерка пользователей, а так же отобраны наиболее значимые с точки зрения данного статистического метода характеристики КП.

ON THE EVALUATION OF THE SIGNIFICANCE OF THE PARAMETERS OF THE USER'S KEYBOARD HANDWRITING USING THE METHOD OF MAIN COMPONENTS

J.I. Eremenko, J.S.Olynina

STI NITU «MISiS»

Тhe article evaluates the significance of the keyboard handwriting parameters required for the user identification procedure. To solve this problem, we propose using the principal component method. The Statistica package analyzes the samples of users' keyboard handwriting, as well as the most important characteristics of the keyboard handwriting from the point of view of this statistical method.

Рассматривая задачу идентификации пользователя по клавиатурному почерку [4,5,6], следует отметить, что для ее решения могут быть использованы различные статистические методы, к которым, в частности, можно отнести факторный и регрессионный анализ, метод главных компонент [4] и т.д. В рамках данной статьи рассматривается применение метода главных компонент для решения вышеуказанной задачи.

Метод главных компонент находит применение в самых различных областях — от задач визуализации данных и распознавания изображений до социологии, нейробиологии и риск-менеджмента [1]. Данный метод предназначен для выделения некоррелированных комбинаций признаков среди коррелированных данных [2].

Главной целью метода главных компонент является уменьшение размерности в данных. Кроме того, он позволяет решать следующие задачи:

1)Сокращение вычислительных затрат при обработке данных;

2)Борьба с переобучением;

3)Сжатие данных для более эффективного хранения информации;

4)Визуализация данных;

5)Извлечение новых признаков [1].

Преимуществами данного метода являются возможность облегчить работу с данными, уменьшив число факторов, требующих внимания, а также выявлять глубинные критерии, характеризующие набор статистических данных [2].

Поскольку метод главных компонент является методом сокращения или редукции данных, то есть методом сокращения числа переменных, возникает вопрос о выборе количества факторов, которое можно определить, используя метод каменистой осыпи [3].

© Еременко Ю.И, Олюнина Ю.С., 2018

211

В соответствии с этим критерием для рассматриваемой статистической выборки, содержащей в себе 100 образцов клавиатурного почерка пользователей, в программном пакете Statistica были получены результаты, представленные на рисунке 1. Согласно данному графику, можно использовать 3 или 4 главных компоненты.

Рисунок 1. Выбор количества главных компонент Дисперсия, объясненная последовательными факторами, представлена на рисунке 2.

После того, как была определена первая главная компонента, определяется следующая линия, максимизирующая остаточную вариацию, и т.д. Так как каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, то факторы оказываются независимыми друг от друга. В случае использования 4 главных компонент, разброс всех значений первая главная компонента объясняет на 44,52%, вторая – на 22,07%, третья – на 7,3% и четвертая – на 6, 72%. Из рисунков 1 и 2 видно, что третья и четвертая главные компоненты имеют схожие значения, поэтому было предложено исследовать оба решения.

Рисунок 2. Дисперсия, объясненная последовательными факторами Проведенный анализ главных компонент и полученное решение с четырьмя

факторами представлен на рисунке 3. Как видно, четвертый фактор менее коррелирован с переменными, чем все предыдущие. Это подтверждает и рисунок 2, согласно которому фактор №4 объясняет всего лишь 6,72 % разброса всех значений.

212

Рисунок 3. Решение с четырьмя факторами Как видно из рисунка, четвертая главная компонента объясняет лишь 6,72 %

разброса всех значений, что говорит о ее низкой значимости в рамках данного анализа. Поэтому было предложено сократить количество главных компонент с 4 на 3, и провести анализ повторно. Результаты полученного решения с 3 компонентами представлены на рисунке 4.

Рисунок 4. Решение с тремя факторами Как видно, качество полученных результатов не значительно отличается от

первоначального, поэтому, учитывая критерий каменистой осыпи, можно использовать три главных компоненты.

Поскольку были выбраны три компоненты, можно считать, что они определяют трехмерное пространство. Поэтому для более наглядного распределения значений можно построить трехмерную диаграмму рассеяния, чтобы показать «логику вращения осей с

213

целью максимизации дисперсии каждого фактора»[2]. Трехмерная модель рассеяния представлена на рисунке 5.

Рисунок 5. Трехмерная диаграмма рассеяния После определения оптимального количества главных компонент, для каждой из 19

серий опытов с объемом выборок от 10 до 100 образцов были получены результаты анализа, представленные на рисунке 6.

Рисунок 6. Результаты анализа методом главных компонент Процентное соотношение показывает, какие из параметров клавиатурного почерка,

соответствующие множеству переменных, оказались избыточными и не попали на прямые, для которых дисперсия максимальна, то есть на выбранные главные компоненты.

Как видно из рисунка 6, такими переменными оказались следующие параметры КП:

среднее время удержания,

214

аритмия

количество исправлений.

Взаключение следует отметить, что вне зависимости от объема выборки образцов почерка некоторые характеристики клавиатурного почерка выступили наиболее значимыми. Другие же, наоборот, оказались избыточными и не попали на прямые, для которых дисперсия максимальна, то есть на выбранные главные компоненты. Таким образом, при проведении процедуры идентификации, некоторые из параметров являются «наиболее значимыми при проведении процедуры идентификации» [6].

Библиографический список

1.Поляк Б. Т., Хлебников М. В. Метод главных компонент: робастные версии // Автоматика и телемеханика, №. 3, 2017. – С.130–148

2.Пестунов И.А., Мельников П.В. Блочный метод главных компонент для выделения информативных признаков при классификации гиперспектральных изображений // Журнал Сибирского федерального университета. Серия «Техника и технологии, 2015. Т. 8. № 6. С. 715-725.

3.Wright J., Peng Y., Ma Y., Ganesh A., Rao S., “Robust Principal Component Analysis: Exact Recovery of Corrupted Low-Rank Matrices by Convex Optimization”, Proc. 23rd Ann. Conf. Neural Inform. Proc. Syst., NIPS 2009 (Vancouver, Canada, December 7–10, 2009), 2080–2088

4.Еременко Ю.И., Олюнина Ю.С. Об определении наиболее значимых параметров клавиатурного почерка с помощью регрессионного анализа// Системы управления и информационные технологии, №2(72), 2018. – С. 28-31

5.Казанцев И. С. Анализ клавиатурного почерка в процессах аутентификации, идентификации и обнаружения подмены оператора // Молодой ученый. — 2016. — №9. — С. 167-169.

6.J.S.Olynina The use of statistical methods for processing the characteristics of the user’s keyboard handwriting. Materials of the International Conference “Scientific research of the SCO countries: synergy and integration” - Reports in English (May 29-30, 2018. Beijing, PRC). – S.23624

215

УДК 004.056

ОБ ОДНОМ ПОДХОДЕ К ОЦЕНКЕ ПРОПУСКНОЙ СПОСОБНОСТИ ИНФОКОММУНИКАЦИОННОЙ СЕТИ

Д.Д. Зверева

Воронежский институт МВД России

Описан подход к оценке пропускной способности инфокоммуникационной сети, основанный на использования алгоритма нахождения максимального потока графовой модели указанной сети.

ONE APPROACH TO EVALUATING THE CAPACITY OF THE

INFOCOMMUNICATION NETWORK

D.D. Zvereva

Voronezh Institute of the Ministry of the Interior of Russia

An approach to the evaluation of the capacity of the infocommunication network is described, based on the use of the algorithm for finding the maximum flow of the graph model of the specified network.

Введение.

Повышение эффективности использования инфокоммуникационной сети или изменение условий её эксплуатации может обеспечиваться модификацией сети.

Как правило, в сети выбираются:

= ’2 , 2 , … , 2|.|

(1)

 

- приоритетные направления передачи информации между узлами отправителями и получателями и задаются требования по их пропускным способностям в отдельности или в совокупности.

В [1] показано, что пропускная способность % по приоритетному направлению передачи информации 2 может быть оценена с помощью использования алгоритма нахождения максимального потока [2].

Пропускная способность по совокупности приоритетных направлений оценивается как взвешенная величина % по формуле:

|.|

= * • % ,

(2)

 

ˆ

где – важности приоритетных направлений для эффективной работы организации, алгоритм нахождения которых описан в [1,3];

Однако указанные оценки будут точными только в том случае, когда приоритетные направления передачи информации не используют одних и тех же линий связи, что является достаточно редкой ситуацией.

Их можно считать верхними оценками пропускной способности.

Ниже предлагается подход, позволяющий учесть указанные обстоятельства.

Оценка пропускной способности.

©Зверева Д.Д., 2018

216

Обозначим элементы инфокоммуникационной сети:

 

 

 

– = {˜ , ˜ , … , ˜||}

(3)

– множество узлов инфокоммуникационной сети;

 

– множество линий связи.

› = {H , H , … , H|œ|}

(4)

H< в свою очередь

 

Каждая

линия связи

характеризуется пропускной

способностью

#<.

 

 

Моделью инфокоммуникационной сети в этом случае можно считать взвешенный ориентированный граф

 

• = (–, ›, j)

(5)

с множеством вершин , дуг и весами дуг

 

 

j = {# , # , … #|œ|}.

(6)

Предположим, что линия связи H<, имеющая пропускную способность #<, может

использоваться в направлениях

2< , 2< , … , 2<ž, важности которых

оцениваются как

< , •< , … , •<ž соответственно.

 

 

 

 

Можно считать, что указанные важности будут учитываться при определении

приоритетов передачи информации по соответствующим направлениям.

 

Это означает, что пропускная способность линии связи H< по приоритетному

направлению 2<будет оцениваться как:

 

 

#<= <#<,

(7)

где <– коэффициент, отражающий приоритет передачи информации по линии H<

для направления 2<.

 

 

 

 

С учетом значений коэффициентов важности направлений величина <может быть

найдена по формуле:

 

<

 

 

 

<=

.

(8)

 

Ÿ ˆ <

Приведём численный пример.

Решим задачу оценки взвешенной пропускной способности сегмента инфокоммуникационной сети.

Рис.1. Графовая модель условного примера сегмента инфокоммуникационной сети с обозначением приоритетных направлений

217

Передача информации по приоритетному направлению 2 от узла отправителя ˜¡ к узлу получателю ˜¢ представляет собой поток сообщений, передаваемый по линиям связи сети, который может перераспределяться на узлах. В этом случае оценкой пропускной способности % инфокоммуникационной сети для приоритетного направления передачи информации является величина максимального потока во взвешенном графе от ˜¡ к ˜¢, что может быть определено с помощью алгоритма Форда-Фалкерсона [4].

Числа, приписанные дугам, соответствуют пропускным способностям линий связи им соответствующим (рис. 1).

В данном сегменте инфокоммуникационной сети обозначены два приоритетных направления: 2 от узла отправителя ˜¡ к узлу получателю ˜£¢ и 2 от узла отправителя ˜¡ к узлу получателю ˜£¢.

Примем равным важность первого направления • = 0,75 , а важность второго -

• = 0,25 .

Необходимо определить величину максимального потока в графе от узла отправителя к узлу получателя каждого из направлений. Используя алгоритм указанный выше можно показать, что для данного графа в соответствии с указанными величинами

пропускных способностей дуг, пропускные способности по направлениям равны:

% = 15, % = 7.

Тогда может быть вычислена величина взвешенной пропускной способности сегмента

сети:

= * • % = 0,75 15 + 0,25 7 = 13.

ˆ

Рассчитаем взвешенную пропускную способность сегмента сети, если пропускная способность линий связи, входящих в оба направления, выделенные в условном примере инфокоммуникационной сети, будет распределяться между приоритетными направлениями пропорционально их важности (рис. 2).

Рис.2. Графовая модель условного примера сегмента инфокоммуникационной сети с распределением пропускных способностей линий связи

218

В данном случае:

n.§

#̃ =

¦

#¥

=

 

 

 

¦ ¦

 

n.§ n.

 

¥

¦

 

 

 

 

n.§

#̃ =

#¨

=

 

 

¦ ¦

n.§ n.

 

¨

¦

 

 

 

 

n,

#̃ =

#¥

=

 

 

¦ ¦

n.§ n.

 

¥

¦

 

 

 

 

n,

#̃ =

#¨

=

 

 

¦ ¦

n.§ n.

 

¨

 

 

 

 

 

 

 

 

 

8 = 6;

12 = 9;

8 = 2;

12 = 3.

Тогда пропускные способности выделенных приоритетных направлений равны:

% = 14, % = 6.

В этом случае величина взвешенной пропускной способности сегмента сети:

© = * • %ª = 0,75 14 + 0,25 6 = 12.

ˆ

Вывод.

Как видно из примера, изменилась пропускная способность направлений в отдельности и взвешенная пропускная способность.

Оценки получены при условии жесткого распределения потоков сообщений, не зависимо от того, свободна линия связи или нет.

Поэтому их можно считать нижними оценками.

В реальных сетях, если линия связи недостаточно загружена на отдельных направлениях, она могла бы передавать больший объём информации по другим направлениям.

Поэтому, если нижние и верхние оценки существенно отличаются, то для получения более точных оценок целесообразно использовать имитационную модель.

Библиографический список

1. Меньших В.В. Модель оптимизации выбора вариантов изменения инфокоммуникационной сети (сегмента сети) / В. В. Меньших, Д. Д. Зверева // Вестник Воронежского института МВД России. — 2018. — №1. — С. 21-26.

2.Меньших В.В. Оценки доступности информации в телекоммуникационных системах / В.В. Меньших, Е.К. Шипова // Информационная безопасность регионов. — 2011.

№ 2. — С. 17-21.

3.Саати Т. Принятие решений. Метод анализа иерархий. Перевод с английского Р. Г. Вачнадзе / Т. Саати. – Москва: Радио и связь, 1993. – 278 с.

4. Дискретная математика: учебник / В.В. Меньших, А.Н. Копылов, В.А. Кучер, С.А. Телкова. – Воронеж: Воронежский институт МВД России, 2016. — 228 с.

219

УДК 69.0036658.12(2)

ИСПОЛЬЗОВАНИЕ ЭКСПЕРТНЫХ СИСТЕМ В ИНВЕСТИЦИОННОЙ ДЕЯТЕЛЬНОСТИ

ЭКОНОМИЧЕСКОЙ ОРГАНИЗАЦИИ

И.П. Кулешова, В.П. Морозов, Е.В. Баутина, С.А. Баркалов Воронежский государственный технический университет

В статье приведено описание основных инструментов информационных технологий (информационных систем, систем поддержки принятия решений, экспертных систем) целесообразных для использования в инвестиционной деятельности экономической организации. Обоснована приоритетность применения экспертных систем для формирования инвестиционных портфелей, как высокоэффективных аналитических средств выбора рациональных активов, базирующихся на практическом опыте специалистов в данной предметной области. Представлен перечень и характеристики основных видов экспертных систем, используемых в инвестиционной деятельности.

THE USE OF EXPERT SYSTEMS IN THE INVESTMENT ACTIVITY OF AN

ECONOMIC ORGANIZATION

I.P. Kuleshovа, V.P. Morozov, E.V. Bautinа, S.A. Barkalov

Voronezh State Technical University

Annotation: in the article the main tools of information technologies (information systems, decision support systems, expert systems) suitable for use in the investment activity of an economic organization are described. The priority of application of expert systems for the formation of investment portfolios, as highly effective analytical tools for selecting rational assets, based on the practical experience of specialists in the given subject area is substantiated. The list and characteristics of the main types of expert systems used in investment activities are presented.

Рост прибыли, повышение финансовой устойчивости, деловой активности, конкурентоспособности являются основными целями любой экономической организации на протяжении всего периода ее функционирования. Так как внешняя среда подвержена постоянными изменениям, предприятиям необходимо всегда осуществлять поиск новых направлений развития, которые будут приносить дополнительный доход. Поэтому каждый хозяйствующий субъект заинтересован в осуществлении инвестиционной деятельности.

Известно, что без финансовых инвестиций развитие экономической организации практически невозможно. Поэтому в последнее время предприятия, получая прибыль в виде дивидендов от инвестиционного портфеля, используют ее для модернизации старых и развития новых производств [2].

Под инвестиционным портфелем понимается собранные вместе для достижения поставленных целей разного вида ценные бумаги и активы (недвижимость, золото и др.). Можно сказать, что целью инвестиционного портфеля является сохранение и увеличение капитала, а также получение текущего дохода одновременно с ростом стоимости основного капитала [2].

Для каждого конкретного инвестора выбирается определенная структура инвестиционного портфеля, с учетом различных факторов, например, таких как: инвестиционные цели, отношение к рискам и прочие. Для составления и оценки

© Кулешова И.П., Морозов В.П., Баутина Е.В., Баркалов С.А., 2018

220