Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования «Российский химико-технологический университет имени Д.И. Менделеева»
Факультет информационных технологий и управления
Кафедра информационных компьютерных технологий
Расчетно-пояснительная записка
к выпускной квалификационной работе на степень бакалавра по
направлению «Информационные системы и технологии»
На тему:
«Разработка программного обеспечения для автоматической каталогизации больших объёмов информации с использованием расширенных
возможностей поискового механизма сайта»
Заведующая кафедрой ИКТ,
д.т.н., профессор Кольцова Э.М.
Руководитель работы
ст. преп. Васецкий А.М.
СТУДЕНТ Лисовский А.А.
Москва
2016
Оглавление
Введение 3
1. Литературный обзор 4
1.1 JSON структура 5
1.2 XML структура 7
1.3 Методы POST и GET 8
1.4 Отладчики 11
2. Теоретическая часть 17
2.1 Механизмы моделирования POST-запросов с использованием фреймворка .NET для С++ 18
Введение
В последнее время в интернете появился ряд сайтов с характерными недостатками поисковых механизмов, а также их разработчики скрывают структуру своих сайтов и не каталогизируют их содержимое; в частности, такой подход характерен для сайтов военно-исторической тематики, которые ведёт разработка компания ЭЛАР (Электронный Архив) по заказу Министерства Обороны Российской Федерации. Примеры сайтов с ранее упомянутыми недостатками: pamyatnaroda.mil.ru [1], www.obd-memorial.ru [2], www.podvignaroda.ru [3], www.germandocsinrussia.org [4]. Данный подход к предоставлению доступа к материалам создаёт серьёзные проблемы для исследователей. Исходя из вышеизложенного, целью нашей работы является разработка программного обеспечения (ПО) для расширения функционала поискового инструментария сайта и каталогизирования его материалов. Задачами данной работы являлись: разработка ПО на языке программирования C++, позволяющего расширить возможности поискового механизма сайта pamyatnaroda.mil.ru; с использованием разработанного ПО, создать каталог избранных материалов сайта; реализация мониторинга обновлений на сайте. Поисковые механизмы сайтов скорее всего созданы на основе алгоритмов Elastic Search (elastic.co).
Цель работы:
Разработка программного обеспечения для расширения функционала поискового инструментария сайта. Использовать возможности поискового механизма сайта «Память народа» для расширения его функционала и каталогизирования его материалов.
Задачи:
Разработка программного обеспечения на языке С++, позволяющего расширить возможности поискового механизма сайта «Память народа».
С использованием разработанного программного обеспечения создать каталог избранных материалов сайта.
Реализация мониторинга обновлений на сайте.
Литературный обзор
Существующие на данный момент архивные сайты:
ОБД «Мемориал» – обобщённый электронный банк данных (ОБД), содержащий информацию о советских воинах, погибших, умерших и пропавших без вести в годы Великой Отечественной войны, а также в послевоенный период. База данных создана Министерством обороны Российской Федерации, техническая часть проекта реализована корпорацией ЭЛАР.
«Подвиг народа» – электронный банк документов, относящихся к периоду Великой Отечественной войны. Содержимое банка данных составляют документы Центрального архива Министерства обороны Российской Федерации (ЦАМО), а именно наградные дела и документы по оперативному управлению боевыми действиями
«Память народа» – проект Память Народа реализован в соответствии с решением Российского оргкомитета Победа от июля 2013 года, поддержан поручением Президента и Постановлением Правительства России в 2014 году. Проект предусматривает публикацию в Интернет архивных документов и документов о потерях и награждениях солдат и офицеров Первой Мировой войны, развитие ранее реализованных Минобороны России проектов о Второй Мировой войне ОБД Мемориал и Подвиг Народа в один проект - Память Народа.
«Немецкие записи» - Российско-германский проект по оцифровке германских документов в архивах Российской Федерации. По инициативе Администрации Президента Российской Федерации в 2011 году был инициирован проект по оцифровке хранящихся в России германских документов. Проект осуществляется Федеральным архивным агентством, Министерством обороны, Российским историческим обществом в сотрудничестве с Германским историческим институтом в Москве.
Вышеупомянутые сайты широко используют существующие стандарты HTML-разметки. Также, характерной особенностью этих сайтов является опора на поисковые скрипты для получения доступа к их материалам. В свою очередь механизм поиска данных скриптов широко использует формат обмена данными JSON.
