Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Сибирская государственная автомобильно-дорожная академия

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

2411

.pdf

Скачиваний:

Добавлен:

07.01.2021

Размер:

8 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 137 8 9 10 11 12 13 > Следующая >>>

2.Владимиров С.А. Методология оценки и анализа экономической эффективности инвестиционных проектов в строительстве: дис. ... д-ра экон. наук. – СПб., 2007.

3.Косов В.В. Методические рекомендации по оценке эффективности инвестиционных проектов /В.В. Косов, В.Н. Лившиц, А.Г. Шахназаров. – М.: Экономика, 2000. – 421 с.

4.Электронный ресурс - http://kribel.ru/invest/010.html

5.Электронный ресурс - http://www.alt-invest.ru/library/themes/invanalysis/me- thod93-/ art64-1.htm

6.Приказ Минэкономразвития РФ от 24.02.2009 № 58 «Об утверждении методики оценки эффективности использования средств федерального бюджета, направляемых на капитальные вложения» (зарегистрировано в Минюсте РФ 27.04.2009

№13833.

УДК 519.816

ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИЙ ПОДХОД К ПОДДЕРЖКЕ ДЕЯТЕЛЬНОСТИ РОСИНКАС

О.А. Попова, канд. техн. наук, доц.,, А.С.Козлова, студентка Сибирская государственная автомобильно-дорожная академия

Организация с особым правовым статусом Российское объединение Инкассации ЦБ РФ (РОСИНКАС) работает в сфере обеспечения безопас-

ности и в сфере инкассации более пятидесяти лет, в Сибирском регионе, в том числе и в Омске, – более двадцати. За это время предприятие накопило колоссальный опыт.

Предприятие РОСИНКАС является подразделением банка России, и работает в соответствии с Федеральным законом. Миссия РОСИНКАС заключается в оказании полного спектра услуг в сфере инкассации, в постоянном движении вперед, в удержании лидерских позиций, также, на сегодня объединение является единственным исполнителем государственного заказа.

Вся деятельность РОСИНКАС сопровождается заключением договоров с клиентами, что сопровождается обязательным хранением, обработкой и анализом информации. За время работы РОСИНКАС на рынке услуг накопились большие объемы данных, оперативная обработка которых требует применения современных методов и подходов к решению таких задач, как сравнительный анализ услуг, потребительских сегментов, каналов сбыта, клиентов, географии (регионы, города, районы); анализ распределения цен на услуги в географическом разрезе, в разрезе услуг, клиентов (их организационно-правовой формы); анализ

пропорциональности развития рынка; сравнительный анализ параметров сделок: средний срок действия договора и т.д.

До настоящего времени для решения перечисленных задач на

предприятиях	РОСИНКАС	применялись различные учетные		системы,
например,	ИУС «Участок инкассации». Данная учетная			система
предназначается в первую		очередь	для быстрого ввода	данных,

обеспечения их целостности при многопользовательском доступе, для быстрой работы со справочниками и документами, оперативного предоставления информации по услугам, о клиентах и так далее. Некоторые функциональные возможности, которые выполняет данная система, в настоящее время уже не нужны или подотчетны другим структурным подразделениям. И наоборот, с появлением новых должностных обязанностей для сотрудников возникла необходимость в качественном и эффективном анализе имеющейся информации, например, если раньше специалист по инкассации просто формировал журнал оказываемых услуг и экспортировал карточки договоров Главному управлению инкассации, то сейчас в его должностные обязанности входит анализ оказываемых услуг, анализ динамики цен на оказываемые услуги. Эта функциональная часть не предусматривается в данной системе.

Возможности данной системы весьма ограничены в реализации четкой тарифной политики. Это очень гибкая функция, поскольку нет определенной тарифный ставки на оказываемую услугу и для каждого клиента одна и та же услуга оказывается по разным тарифным расценкам.

Отчеты учетной системы не всегда соответствуют потребностям руководителя и другим внутренним пользователям. Создание же других, дополнительных отчетов требует участия высококвалифицированных специалистов в этой области и программистов, а также зачастую большого количества времени. Таким образом, в системе накапливается большое количество отчетов, из которых лишь малая часть отражает корректную информацию на сегодняшний день.

Для выявления других проблемных зон в осуществлении компьютерной поддержки деятельности РОСИНКАС были выбраны следующие системы: DIRECTUM «Управление договорами», Евфрат «Управление договорами», Кларис. Программа учета договоров, 1С Предприятие 8 «Учет договоров». Данные системы позволяют вести сбор, обработку, систематизацию и отражение информации в специальных регистрах на каких-либо носителях, также данные системы больше пригодны для документооборота, делопроизводства. Ни одна из представленных систем не позволяет проводить аналитику, а именно это необходимо специалисту по инкассации.

В качестве решения данной проблемы предлагается использовать компьютерные системы поддержки принятия решений (КСППР),

реализующих информационно-аналитический подход. К таким системам можно отнести программно–аналитическую платформу Deductor, информационно-аналитическую систему SPSS, SAS и другие. Однако специфика деятельности РОСИНКАС требует разработки специализированных КСППР, направленных на поддержку задач именно данной сферы деятельности.

Информационно-аналитический подход заключается в применении современных методов анализа данных больших объемов, которые составляют технологию Data Mining. В основу современной технологии Data Mining положена концепция шаблонов, отражающих закономерности, свойственные подвыборкам данных. Поиск шаблонов производится методами, не использующими никаких априорных предположений об этих подвыборках [1].

Важной особенностью Data Mining является нестандартность и неочевидность разыскиваемых шаблонов. Иными словами, средства Data Mining отличаются от инструментов статистической обработки данных и средств OLAP тем, что вместо проверки заранее предполагаемых пользователями взаимозависимостей они на основании имеющихся данных способны находить такие взаимозависимости самостоятельно и строить гипотезы об их характере.

Применение методов Data Mining для поддержки деятельности РОСИНКАС в сфере анализа позволит решать такие задачи, как классификация ( отнесение входного вектора (объекта, события, наблюдения) к одному из заранее известных классов); кластеризация - разделение множества входных векторов на группы (кластеры) по степени «похожести» друг на друга; ассоциация (поиск повторяющихся образцов, выявление закономерностей между связанными событиями); визуализация.

Проблемы бизнес-анализа формулируются в соответствии с задачами предприятия с целью повышения эффективности принимаемых решений. Решение большинства из них сводится к той или иной задаче Data Mining или к их комбинации.

Для решения вышеописанных задач используются различные методы и алгоритмы Data Mining. Ввиду того, что Data Mining развивалась и развивается на стыке таких дисциплин, как статистика, теория информации, машинное обучение, теория баз данных, вполне закономерно, что большинство алгоритмов и методов Data Mining были разработаны на основе различных методов из этих дисциплин [2].

В системах, с помощью которых возможны решения такого рода задач, вся информация, в том числе архивная, собрана и представлена в связанном виде. В результате чего в достаточно сжатые сроки можно получить ответы на многие вопросы, появляется возможность проводить разносторонние исследования.

Библиографический список

1.Методы и модели анализа данных: OLAP и Data Mining/ А.А. Барсегян и др.М.:2004. 335 с.

2.ЕлмановаН. ВведениевDataMining/Н.Елманова//КомпьютерПресс. 2003. №10.

УДК 519.816

РАЗРАБОТКА ИНФОРМАЦИОННО – ПОИСКОВЫХ СИСТЕМ ДЛЯ ПОЛНОТЕКСТОВЫХ БИБЛИОТЕК

Б.С.Добронец,д-рфиз.-мат.наук, проф.,А.В. Попов, аспирант Сибирский федеральный университет ( г. Красноярск)

Одним из наиболее перспективных способов информационного обеспечения науки, культуры и образования сегодня (и тем более завтра) является использование электронных библиотек (ЭБ), состоящих из большого числа документов. Документы в таких библиотеках могут храниться в совершенно различных форматах: от обычных текстовых, до PDF и DjVu. Поэтому особую актуальность приобретает проблема поиска необходимой информации в таких библиотеках, всё более остро встает проблема скорости получения информации и её релевантности. Особенно важно найти не только сам документ, но и конкретное вхождение искомой информации в нем, т. е. “найти нужную страницу или абзац в книге”.

Работы в области поиска информации начались задолго – в докомпьютерную эру. За начало отсчета таких систем принято считать публикацию в 1945 г. в журнале The Atlantic Monthly статьи “Как мы можем думать” (As We May Think) Ванневара Буша(Vannevar Bush), в то время советника по науке президента США Рузвельта. Статья содержала основные понятия, которые позднее были использованы при разработке гипертекстовых систем.

Ванневар Буш предложил Memex – устройство, в котором человек может хранить свои книги, архивы документов, записные книжки с контактными адресами и телефонами и которое при этом автоматизировано так, что ко всем этим своим – персонального назначения

– информационным материалам человек может быстро и гибко обращаться. Это оказалось бы, по сути, расширением возможностей персональной памяти человека и тем самым помощи в решении различных задач.

В 1965 г. Тед Нельсон придумал и первым ввел в компьютерный научно-технический лексикон термин “гипертекст”. Термины “гипертекст” (hypertext) и “гипермедиа” (hyper-media) были впервые опубликованы Тедом Нельсоном в сборнике трудов 20-й национальной конференции АСМ в 1965 г.

Для целей гипертекста были придуманы: многооконный интерфейс, манипулятор типа мышь, текстовые редакторы, и все это в середине 60-х.

Вистории развития гипертекстовых технологий и электронных библиотек важную роль, на наш взгляд, играет гипертекстовая библиотечная система Xanadu. Хотя, по мнению многих, проект Xanadu так и не был практически реализован в полной мере, тем не менее он оказал определенное влияние на развитие гипертекста и многих других приложений.

В1981 г. Тед Нельсон создает концепцию Xanadu глобально централизованной гипертекстовой базы данных, охватывающей всю открыто доступную в мире для машинного ее хранения и коммерческого использования письменную информацию. Тед Нельсон выступил против современной архитектуры файловых систем, в его системе каждый бит всех компьютеров должен иметь уникальный адрес. Полная разработка системы типа Xanadu позволила бы создать двусторонние связи, которые не изменялись бы при изменении документов (transclusion), хранить практически все версии документов (osmic) и самое главное дала бы возможность одновременной разметки документов (pluralistic hypertext). Основные положения включают такие понятия, как виртуальное включение (transclusion), перекрестно взаимосвязанная литература

(connected literature), плюралистическая литература (pluralistic hypertext literature), Вселенная документов (docuverse). Подход Xanadu позволяет сделать ссылку на любую часть документа из любого документа, связи, накладываемые на документы, хранятся отдельно. Проект Xanadu развивался именно как универсальная библиотека, как средство свободного доступа и обсуждения [1].

Безусловно, реализовать весь подход Xanadu не представляется возможным, тем не менее отдельные части проекта нашли применение в различных коммерческих пакетах и заслуживают внимания.

Наибольший интерес для нас представляют полнотекстовые электронные библиотеки. В настоящее время существует достаточно много библиотечных систем, в том числе и с открытым кодом. Практически все из них обладают определенными достоинствами, однако на сегодня из этого множества библиотечных систем по функциональности, известности, использованию и русской локализации

выделяются три DSpace, EPrints и Greenstone, в качестве примеров эффективного использования которых можно привести научную библиотеку Уральского государственного университета (DSpace), электронную библиотеку правительства республики Марий Эл и проект создания распределенной электронной библиотеки LibWeb (Greenstone). С позиций существующих локализаций, возможно, большее внимание отечественными исследователями было уделено системе Greenstone [1].

Анализ существующих полнотекстовых электронных библиотек (ПЭБ) показывает необходимость создания таких систем, которые позволяли бы работать эффективно многим индексаторам над созданием цифровых коллекций документов, обеспечить поиск необходимого контекста и использовать интеллектуальный анализ текста. Есть определенное мнение, что индексирование документов должно осуществляться в автоматическом режиме. Но бывают случаи, когда даже самая совершенная программа не сможет отметить особенность документов. Поэтому подобные системы должны предусматривать возможность ручного индексирования отдельных частей документа и индексирования документа несколькими индексаторами (плюрализм мнений индексаторов). Заметим, что при этом крайне важно, чтобы исходные документы остались в неизменном виде. Поскольку в коллекциях часто встречаются разные издания одной книги, важно научиться работать с версиями документов (не требовать повторного индексирования новых изданий). Важной частью подобных систем является и возможность поиска аналогий.

Отметим одну особенность, присущую современным ЭБ, это наличие в коллекциях документов в форматах PDF и DjVu. Кроме того, ЭБ могут содержать большое число аудио- и видеодокументов. Возникает потребность индексирования и поиска в таких документах.

Далее опишем информационно-поисковую систему (ИПС) для ПЭБ с хранением документов в текстовом виде. Дальнейшее расширение на другие форматы будет возможно подключением дополнительных модулей.

Информационно-поисковые языки

Процесс создания информационно-поисковой системы (ИПС) во многом определяется разработкой специализированного информационнопоискового языка (ИПЯ). Основная роль, которую играют ИПЯ, состоит в записи на нем поисковых образов (ПО) документов и поисковых заданий (ПЗ). Специфическая роль, которую должен играть такой язык, будет меняться в зависимости от библиотеки, фонда и читателей. Выбор или разработка ИПЯ является, вероятно, наиболее трудной ступенью в разработке информационно-поисковой системы.

Требования к информационно-поисковым языкам

Некоторыми характерными особенностями языка, служащего для индексирования, являются следующие:

с одной стороны, ИПЯ должен однозначно восприниматься компьютером, с другой стороны, желательно, что бы он был понятен и человеку для ручного поиска;

поисковые образы (ПО), записанные на ИПЯ, должны в достаточной мере описывать соответствующие документы. При этом полнота описания определяется не только степенью детализации, но и концентрацией на

“нужном” предмете. Сам же “нужный” предмет в поисковом образе будет меняться в зависимости от групп потребителей;

ПО объединяются в массивы, называемые индексом. Структура индексов должна быть разработана таким образом, чтобы обеспечить быстрый поиск и высокую релевантность результата;

с течением времени языки вообще, и ИПЯ в частности, изменяются. Правильно построенные ИПЯ должны обладать возможностями модификации по мере того, как изменяется язык документов или потребителей. Например, с появлением нового формата хранения информации или новой группы потребителей ИПЯ не должен оказываться непригодным или не масштабируемым.

Большое значение имеет надежность разрабатываемой информационной системы, следовательно, необходимо предусмотреть соответствующие действия.

Структура поисковых образов

Поиск по большим массивам данных во многом зависит от организации индексных файлов, содержащих в том или ином объеме сведения о массивах.

Язык описания документов

Индексируемый документ F представляется как покрытие:

где фрагменты документа. Каждому фрагменту сопоставляется набор , где – ключевое слово и – его значимость. Значения принадлежат некоторому упорядоченному множеству {1,2…5}.

Далее будем предполагать, что выполняются следующие соотношения: если некоторый фрагмент содержится во фрагменте , то

набор ключевых содержится в . Более того, будем считать, что фрагменту соответствует набор ключевых слов . Таким

образом, мы определили правило наследования ключевых слов.

Структура индексных файлов

В качестве индексных файлов используются инвертированные списки. Индексный файл содержит ключевые слова, отсортированные для ускорения поиска в алфавитном порядке. За каждым ключевым словом следуют ссылки на файлы, с указанием фрагмента , где данное ключевое слово встречается и указывается его смысловая значимость. Таким образом, фрагмент индексного файла выглядит следующим образом:

*.log файл

Для каждого документа F создаётся вспомогательный файл F.log, который играет роль дневника работы (это необходимо для обеспечения надежности, также дает возможность продолжить прерванное индексирование с того момента, на котором оно было прервано). Каждый

индексатор работает только с файлами типа .log. Далее файлы типа .log

используются для пополнения основного индексного файла. Структура его такова:

…

SESSION OPEN= Дата_индексации_n ADD

Ключевое_слово_m	;
Ключевое_слово_m+1	;
DEL
Ключевое_слово_m	;
Ключевое_слово_m+1	;

SESSION CLOSED

SESSION OPEN= Дата_индексации_n+1

ADD

Ключевое_слово_m	;
Ключевое_слово_m+1	;
DEL
Ключевое_слово_m	;
Ключевое_слово_m+1	;
SESSION CLOSED
…

где , – номера абзацев/страниц начала и конца фрагмента документа

, значения – значимость.

Каждая сессия индексации документа заключена между специальных фраз SESSION OPEN и SESSION CLOSED. Это обеспечивает возможность в любой момент вернуться к одному из прежних состояний, а также отменить результаты последних сессий индексации вплоть до самой первой сессии.

Между специальными словами ADD и DEL стоят ключевые слова, добавленные в текущей сессии. Между DEL и SESSION CLOSED – удалённые.

Файл ключевых слов (основной индексный файл)

Файл ключевых слов включает в себя ключевые слова, собранные по всем документам, инвертированный список в этом файле может быть построен по информации из *.log файлов для книг либо в ходе ручной индексации книги, без последующей записи в файлы *.log. Данный файл описывает документ согласно языку, представленному выше. Формат его фрагмента выглядит следующим образом:

....

Ключевое_слово_n ссылка_на_файл_

ссылка_на_файл_

...

Ключевое_слово_n+1 ссылка_на_файл_

ссылка_на_файл_

Отметим, что ссылка_на_файл_ – это номер документа в системе, по которому идентифицируется книга через файл списка книг.

Глобальный индексный файл

Стоп-словарь – список слов, содержащий часто встречающиеся слова, которые не несут большой смысловой нагрузки.

Данный файл включает в себя все слова всех документов, исключая слова, входящие в стоп-словарь системы.

Глобальный индексный файл имеет несколько отличную от файла ключевых слов структуру. Создается он в процессе автоматической индексации, пользователь не принимает участия в его создании. Данный файл включает в себя все слова всех документов, исключая слова, входящие в стоп-словарь системы.

Формат его фрагмента выглядит следующим образом:

....

Слово_n номер_файла_