3.6.1 Параметры вычисление хеш-функции: полином-генератор, разрядность и стартовое слово

В качестве примера рассмотрим схему формирования контрольной суммы CRC-8. Порождающий многочлен g(x) = x8+x5+x4+1. Говоря о формировании контрольной суммы CRC, в первую очередь нужно упомянуть о полиноме-генераторе.

Другим параметром конкретного алгоритма вычисления контрольной суммы является размер слова, или суммарное количество регистров — информационных ячеек, используемых для вычисления численного значения хеш-функции. При этом обязательно учитывается то, что размер слова и степень образующего контрольную сумму полинома совпадают. На практике более всего распространены 8, 16 и 32 — битовые слова, что является следствием особенностей архитектуры современной вычислительной техники.

И последний параметр, важный при описании определенной методики — начальные состояния регистров (стартовое слово). Это последняя из трех значимых характеристик; зная их в совокупности, мы можем восстановить алгоритм вычисления CRC.

3.6.2 Популярные и стандартизованные полиномы

В то время, как циклические избыточные коды являются частью стандартов, у этого термина не существует общепринятого определения — трактовки различных авторов нередко противоречат друг другу.

Этот парадокс касается и выбора многочлена-генератора: зачастую стандартизованные полиномы не являются самыми эффективными в плане статистических свойств соответствующего им check reduntancy code.

При этом многие широко используемые полиномы не являются наиболее эффективными из всех возможных. В 1993—2004 годах группа учёных занималась исследованием порождающих многочленов разрядности до 16, 24 и 32 бит, и нашла полиномы, дающие лучшую, нежели стандартизированные многочлены, производительность в смысле кодового расстояния. Один из результатов этого исследования уже нашёл своё применение в протоколе iSCSI.

Самый популярный и рекомендуемый IEEE полином для CRC-32 используется в Ethernet, FDDI; также этот многочлен является генератором кода Хемминга. Использование другого полинома — CRC-32C — позволяет достичь такой же производительности при длине исходного сообщения от 58 бит до 131 кбит, а в некоторых диапазонах длины входного сообщения могут быть даже выше — поэтому в наши дни он тоже пользуется популярностью. К примеру, стандарт ITU-T G.hn использует CRC-32C с целью обнаружения ошибок в полезной нагрузке.

В Википедии (http://ru.wikipedia.org/wiki/Циклический_избыточный_код) перечислены наиболее распространенные многочлены — генераторы CRC.

3.7 Виды представления исходного кода

Другие системы обнаружения плагиата рассматривают исходный код "как есть". Например, так поступают детекторы плагиата, которые работают с кодом так же, как и с обычными текстами. Но они крайне неэффективны для решения нашей задачи, так как переименование функций и переменных или несущественные изменения в коде являются серьезными препятствиями для их правильной работы. Иногда используется параметризованное представление кода. Один из его вариантов таков: имена функций и переменных заменяются при первой встрече в коде на ноль, а при последующих на расстояние до предыдущей позиции. Обычно детекторы, основанные на этих двух представлениях, лучше находят плагиат, чем системы "подсчитывающие отличительные черты", а также способны находить плагиат в случаях, когда скопирована только часть программы.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 2711 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.04.2015208.9 Кб7СОВЕТСКАЯ РОССИЯ.doc
#
06.05.20191.45 Mб18Содержание1.doc
#
06.05.2019113.66 Кб7Социальное управление.doc
#
14.08.2019873.29 Кб11спец часть.docx
#
01.03.20252.2 Mб3Страница 293-447.doc
#
01.07.20254.87 Mб7Текст диплома магистра - 12 июня 2014.doc
#
09.04.2015331.26 Кб24Теория для лаб1.doc
#
01.07.202569.52 Кб2Тесты по экономике.docx
#
18.09.20196.41 Mб38ТЕХНИЧЕСКИЕ ИЗМЕРЕНИЯ И ПРИБОРЫ ОТРАСЛИ.doc
#
01.05.20253.74 Mб8технология выпечки хлеба.rtf
#
18.09.20193.15 Mб46ТИП 3 (окончательное исправление).doc