Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Litobzor2a.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.81 Mб
Скачать

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования «Российский химико-технологический университет имени Д.И. Менделеева»

Факультет информационных технологий и управления

Кафедра информационных компьютерных технологий

Расчетно-пояснительная записка

к выпускной квалификационной работе на степень бакалавра по

направлению «Информационные системы и технологии»

На тему:

«Разработка программного обеспечения для автоматической каталогизации больших объёмов информации с использованием расширенных

возможностей поискового механизма сайта»

Заведующая кафедрой ИКТ,

д.т.н., профессор Кольцова Э.М.

Руководитель работы

ст. преп. Васецкий А.М.

СТУДЕНТ Лисовский А.А.

Москва

2016

Оглавление

Введение 3

1. Литературный обзор 4

1.1 JSON структура 5

1.2 XML структура 7

1.3 Методы POST и GET 8

1.4 Отладчики 11

2. Теоретическая часть 17

2.1 Механизмы моделирования POST-запросов с использованием фреймворка .NET для С++ 18

Введение

В последнее время в интернете появился ряд сайтов с характерными недостатками поисковых механизмов, а также их разработчики скрывают структуру своих сайтов и не каталогизируют их содержимое; в частности, такой подход характерен для сайтов военно-исторической тематики, которые ведёт разработка компания ЭЛАР (Электронный Архив) по заказу Министерства Обороны Российской Федерации. Примеры сайтов с ранее упомянутыми недостатками: pamyatnaroda.mil.ru [1], www.obd-memorial.ru [2], www.podvignaroda.ru [3], www.germandocsinrussia.org [4]. Данный подход к предоставлению доступа к материалам создаёт серьёзные проблемы для исследователей. Исходя из вышеизложенного, целью нашей работы является разработка программного обеспечения (ПО) для расширения функционала поискового инструментария сайта и каталогизирования его материалов. Задачами данной работы являлись: разработка ПО на языке программирования C++, позволяющего расширить возможности поискового механизма сайта pamyatnaroda.mil.ru; с использованием разработанного ПО, создать каталог избранных материалов сайта; реализация мониторинга обновлений на сайте. Поисковые механизмы сайтов скорее всего созданы на основе алгоритмов Elastic Search (elastic.co).

Цель работы:

Разработка программного обеспечения для расширения функционала поискового инструментария сайта. Использовать возможности поискового механизма сайта «Память народа» для расширения его функционала и каталогизирования его материалов.

Задачи:

  1. Разработка программного обеспечения на языке С++, позволяющего расширить возможности поискового механизма сайта «Память народа».

  2. С использованием разработанного программного обеспечения создать каталог избранных материалов сайта.

  3. Реализация мониторинга обновлений на сайте.

  1. Литературный обзор

Существующие на данный момент архивные сайты:

ОБД «Мемориал» – обобщённый электронный банк данных (ОБД), содержащий информацию о советских воинах, погибших, умерших и пропавших без вести в годы Великой Отечественной войны, а также в послевоенный период. База данных создана Министерством обороны Российской Федерации, техническая часть проекта реализована корпорацией ЭЛАР.

«Подвиг народа» – электронный банк документов, относящихся к периоду Великой Отечественной войны. Содержимое банка данных составляют документы Центрального архива Министерства обороны Российской Федерации (ЦАМО), а именно наградные дела и документы по оперативному управлению боевыми действиями

«Память народа» – проект Память Народа реализован в соответствии с решением Российского оргкомитета Победа от июля 2013 года, поддержан поручением Президента и Постановлением Правительства России в 2014 году. Проект предусматривает публикацию в Интернет архивных документов и документов о потерях и награждениях солдат и офицеров Первой Мировой войны, развитие ранее реализованных Минобороны России проектов о Второй Мировой войне ОБД Мемориал и Подвиг Народа в один проект - Память Народа.

«Немецкие записи» - Российско-германский проект по оцифровке германских документов в архивах Российской Федерации. По инициативе Администрации Президента Российской Федерации в 2011 году был инициирован проект по оцифровке хранящихся в России германских документов. Проект осуществляется Федеральным архивным агентством, Министерством обороны, Российским историческим обществом в сотрудничестве с Германским историческим институтом в Москве.

Вышеупомянутые сайты широко используют существующие стандарты HTML-разметки. Также, характерной особенностью этих сайтов является опора на поисковые скрипты для получения доступа к их материалам. В свою очередь механизм поиска данных скриптов широко использует формат обмена данными JSON.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]