3048

.pdf

Скачиваний:

Добавлен:

16.03.2016

Размер:

63.23 Кб

Скачать

☆

ОБНАРУЖЕНИЕ ПЛАГИАТА В ИСХОДНОМ КОДЕ ПРОГРАММ С ИСПОЛЬЗОВАНИЕМ ИХ МЕТРИЧЕСКИХ ХАРАКТЕРИСТИК

А.Н. Мироненко, кандидат технических наук, доцент ФГБОУ ВПО «Омский государственный университет им. Ф.М. Достоевского, г. Омск

E-mail: mironim84@mail.ru

Существует много решений позволяющих выявить плагиат в рефератах, курсовых, дипломах и т.п., но они абсолютно не применимы для проверки на плагиат программного кода. Можно говорить, что программа является плагиатом, если она содержит в себе значительную часть (на уровне языка программирования) другой программы. При этом субъект, который пытается выдать чужую программу за свою вносит незначительные изменения в код, например, добавляет пустые строки, переименовывает переменные или функции, переносит отдельные функции в другой участок кода, что позволяет успешно проходить проверку на плагиат, если используются системы выявляющие заимствования в рефератах, курсовых работах и т.п., но по сути, все это не делает «новую» программу оригинальной, она по-прежнему является плагиатом.

Прежде чем приступить выявлению плагиата в программном коде необходимо каким-то образом его подготовить для дальнейшей работы. Существуют различные подходы к решению данной задачи [1], мною был выбран подход, в котором программа представляется в виде точки на n-мерном пространстве [2], каждая i-я координата которой — это некоторая количественная метрика, т.е. программа — это точка. В качестве координат могут выступать, например, средняя длина строки, средняя длина имени переменной или функции, количество используемых стандартных команд или операторов цикла/ветвления и т.п.

Для вычисления i-й координаты (количественной метрики) предлагается использовать метрики оценки качества программного продукта (Метрика Холстеда[3] и метрика Джилба[3]) и количество используемых в программе операторов цикла.

Описанные действия можно назвать подготовительным этапом. Алгоритм выявления плагиата состоит из следующих шагов:

1)Представляем программу, которая подозревается в плагиате в виде точки A(x1, x2, …, xn), где xi – значение количественной метрики;

2)Представляем программу, с которой мы хотим сравнить подозреваемую программу B(x1, x2, …, xn), где xi – значение количественной метрики;

3)Размещаем полученные точки на n-мерном пространстве

4)Определяем расстояние между точками A(x1, x2, …, xn) и B(x1, x2, …, xn)

впространстве, если оно мало, то можно говорить, что подозреваемая в плагиате программа проверку не прошла.

Очевидно, что по предложенному алгоритму можно осуществлять проверку не одной программы, а сразу нескольких и сравнивать можно с программами из уже существующей базы уникальных программ, причем хранить коды в базе не обязательно, достаточно сохранить только метрики.

Список литературы:

1.Обзор автоматических детекторов плагиата в программах // http://detector.spb.su URL: http://detector.spb.su/bin/view/Sandbox/ProjectOutput (дата обращения: 21.08.2015).

2.Обзор алгоритмов обнаружения плагиата в исходных кодах программ //

http://rain.ifmo.ru/

URL:

http://rain.ifmo.ru/cat/data/theory/unsorted/plagiarism-

2006/article.pdf (дата обращения: 05.09.2015).

3. Метрики кода и их практическая реализация в Subversion и ClearCase. // http://cmcons.com URL: http://cmcons.com/articles/CC_CQ/dev_metrics/mertics_part_1/ (дата обращения: 05.09.2015).

Соседние файлы в папке 3-Prikladnye-informacionnye-tehnologii

#
16.03.2016325.41 Кб183043.pdf
#
16.03.201698.58 Кб163044.pdf
#
16.03.201658.45 Кб163045.pdf
#
16.03.2016125.81 Кб163046.pdf
#
16.03.201672.84 Кб163047.pdf
#
16.03.201663.23 Кб163048.pdf
#
16.03.2016185.75 Кб163049.pdf
#
16.03.2016112.69 Кб163050.pdf
#
16.03.201673.94 Кб163051.pdf
#
16.03.201680.31 Кб163052.pdf
#
16.03.2016117.44 Кб193053.pdf