Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет прикладной биотехнологии

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Текст диплома магистра - 12 июня 2014.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

4.87 Mб

Скачать

☆

1 / 271 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Содержание

СОДЕРЖАНИЕ 4

ВВЕДЕНИЕ 7

Актуальность магистерской диссертации 7

Понятие плагиата 9

Специфика понятия «плагиат» в программировании: окончательный вывод о заимствовании делает человек 10

1 Постановка задачи 11

1.1 Необходимость дополнительной проверки на основе анализа структурного анализа кодов 11

1.2 Общая схема работы модулей инструментальной системы поиска плагиата 13

2 Теоретические основы поиска плагиата в исходных кодах программ 15

2.1 Классификация методов поиска плагиата в программировании 15

2.2 Атрибутные методы поиска плагиата 15

2.3 Структурные методы поиска плагиата 16

2.3.1 Строковое выравнивание 17

2.3.2 Метод поиска на XML-представлении 17

2.3.3 Использование приближения Колмогоровской сложности 18

2.3.4 Метод идентификационных меток 18

2.3.5 Нейросетевые методы обнаружения плагиата 19

2.4 Другие методы 19

3 Методы поиска плагиата в произвольных текстах 20

3.1 Локальные методы 20

3.1.1 LongSent 20

3.1.2 Методы на основе меры TF 20

3.1.3 Методы, использующие понятия шинглов 20

3.1.4 Методы, использующие семантические сети 21

3.2 Глобальные методы 21

3.2.1 Методы на основе меры TF-IDF 21

3.2.2 I-Match метод 22

3.2.3 Метод «опорных» слов 23

3.3 Метод шинглов 24

3.3.1 Канонизация текстов 25

3.3.2 Разбиение на шинглы 26

3.3.3 Вычисление хешей шинглов 27

3.4 Дистанция (расстояние) Левенштейна 27

3.4.1 Алгоритм Вагнера — Фишера 31

3.5. Наибольшая общая последовательность (longest common subsequence, LCS) 32

3.6 Вычисление хеш-функции 33

3.6.1 Параметры вычисление хеш-функции: полином-генератор, разрядность и стартовое слово 40

3.6.2 Популярные и стандартизованные полиномы 40

3.7 Виды представления исходного кода 41

3.8 Представление исходного кода в виде токенов 41

4 Обзор инструментальных средств и сервисов анализа плагиата в программах и произвольных текстах 43

4.1 Обзор программ поиска плагиата в программировании 43

4.2 Обзор сервисов поиска плагиата 43

4.3 Обзор программ поиска плагиата в произвольных текстах 46

5 Описание используемых методов поиска плагиата в исходных кодах и произвольных текстах 48

5.1 Общая схема поиска 48

5.1.1 Cхема поиска для исходных кодов 48

5.1.2 Основной структурный метод для анализа исходных кодов 48

5.1.2.1 Достоинства и недостатки 50

5.1.3 Дополнительный атрибутный метод для исходных текстов 50

5.1.3.1 Достоинства и недостатки 51

5.2.1 Cхема поиска для произвольных текстов (в том числе и программ) 52

6 Программная реализация модуля поиска плагиата методами анализа исходных кодов программ 53

6.1 Интерфейс модуля поиска плагиата в исходных кодах программ 53

6.1.1 Главное окно модуля поиска плагиата методами анализа исходных кодов 53

6.1.2 Окно групповых режимов анализа 55

6.2 Взаимодействие модуля поиска плагиата методами анализа исходных кодов 55

6.2.1 Взаимодействие модуля с архивом работ и базой языков (добавление файла в базу) 55

6.2.2 Взаимодействие модуля с архивом работ и базой языков (частотный анализ, автоматический частотный анализ) 56

6.2.3 Взаимодействие модуля с архивом работ и базой языков (автоматический анализ последовательностей операторов) 57

6.2.4. Взаимодействие модуля с архивом работ и базой языков (анализ последовательностей операторов, просчет всех пиков) 57

6.2.5 Взаимодействие модуля с архивом работ и базой языков (удаление файла/языка из базы) 58

6.2.6 Взаимодействие модуля с базой языков (добавление языка в базу) 58

6.2.7 Пакетный режим анализа (1->n) 60

6.2.8 Полный анализ (n->n) 60

6.2.9 Поиск первоисточника и списка первоисточников 60

6.2.10 Некоторые особенности модуля 60

6.3 Описание отчетов по анализу плагиата 61

6.3.1 Критерии автоматического заключения о наличии плагиата при пакетном и полном анализе 61

6.3.2 Алгоритм поиска первоисточника для файла или списка первоисточников при полном анализе 63

6.3.3 Сводный отчет 64

6.3.4 Итоговый отчет 71

6.3.5 Экспорт итогового протокола в Excel 76

6.3.5.1 Исследование итогового протокола по полученным диаграммам Excel 78

6.3.6 Экспорт списка первоисточников в Excel 80

6.3.6.1 Исследование списка первоисточников в Excel 80

6.4 Пример работы модуля 80

6.4.1 Пример 1 анализа последовательности операторов 80

6.4.2 Пример 2 автоматического анализа частот появления операторов 85

7 Программная реализация модуля PlagiatSearch поиска плагиата методами сравнения произвольных текстов 86

7.1 Интерфейс модуля PlagiatSearch поиска плагиата методами сравнения произвольных текстов 86

7.1.1 Главное окно модуля PlagiatSearch поиска плагиата методами сравнения произвольных текстов 86

7.1.2 Меню «Анализ» и его возможности для поиска плагиата в произвольных текстах 88

7.1.3 Информационное окно модуля PlagiatSearch поиска плагиата в произвольных текстах с результатами вычисления дистанции Левенштейна 94

7.1.4 Представление результатов нахождения наибольшей общей подпоследовательности (longest common subsequence, LCS) 96

7.1.5 Представление метода шинглов для сравнения произвольных текстов 96

7.1.6 Применение метода шинглов для сравнения исходных кодов 97

ЗАКЛЮЧЕНИЕ 99

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ (БИБЛИОГРАФИЧЕСКИЙ СПИСОК) 100

ПРИЛОЖЕНИЕ 104

Доработанная блок-схема алгоритма анализа последовательности операторов (с показом наиболее длинного совпадающего фрагмента кода) 104

1 / 271 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.04.2015208.9 Кб7СОВЕТСКАЯ РОССИЯ.doc
#
06.05.20191.45 Mб18Содержание1.doc
#
06.05.2019113.66 Кб7Социальное управление.doc
#
14.08.2019873.29 Кб11спец часть.docx
#
01.03.20252.2 Mб3Страница 293-447.doc
#
01.07.20254.87 Mб7Текст диплома магистра - 12 июня 2014.doc
#
09.04.2015331.26 Кб24Теория для лаб1.doc
#
01.07.202569.52 Кб2Тесты по экономике.docx
#
18.09.20196.41 Mб38ТЕХНИЧЕСКИЕ ИЗМЕРЕНИЯ И ПРИБОРЫ ОТРАСЛИ.doc
#
01.05.20253.74 Mб8технология выпечки хлеба.rtf
#
18.09.20193.15 Mб46ТИП 3 (окончательное исправление).doc