Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпора информатика.docx
Скачиваний:
9
Добавлен:
24.09.2019
Размер:
322.97 Кб
Скачать

Сложение двоичных чисел

Способ сложения столбиком в общем-то такой же как и для десятичного числа. То есть, сложение выполняется поразрядно, начиная с младшей цифры. Если при сложении двух цифр получается СУММА больше девяти, то записывается цифра=СУММА- 10, а ЦЕЛАЯ ЧАСТЬ (СУММА /10), добавляется в старшему разряду. (Сложите пару чисел столбиком вспомните как это делается.) Так и с двоичным числом. Складываем поразрядно, начиная с младшей цифры. Если получается больше 1, то записывается 1 и 1 добавляется к старшему разряду (говорят "на ум пошло").

Выполним пример: 10011 + 10001. 

 Первый разряд: 1+1 = 2. Записываем 0 и 1 на ум пошло.

Второй разряд: 1+0+1(запомненная единица) =2. Записываем 0 и 1 на ум пошло.

Третий разряд: 0+0+1(запомненная единица) = 1. Записываем 1.

Четвертый разряд 0+0=0. Записываем 0.

Пятый разряд 1+1=2. Записываем 0 и добавляем к шестым разрядом 1. 

Умножение в двоичной системе счисления

Для начала рассмотрим следующий любопытный факт. Для того, чтобы умножить двоичное число на 2 (десятичная двойка это 10 в двоичной системе) достаточно к умножаемому числу слева приписать один ноль. Если мы вспомним, что любое двоичное число разлагается по степеням двойки, то становится ясно, что умножение в двоичной системе счисления сводится к умножению на 10 (то есть на десятичную 2), а стало быть, умножение это ряд последовательных сдвигов. Общее правило таково: как и для десятичных чисел, умножение двоичных выполняется поразрядно. И для каждого разряда второго множителя к первому множителю добавляется один ноль справа.

11. Двоично-десятичная СС. Беззнаковое и знаковое представление чисел в ячейке памяти: прямой, обратный и дополнительный код. Знаковый разряд. Преобразование чисел между различными знаковыми кодами. Перенос и переполнение и их индикаторы

Двоично-десчтичное число представляет собой десятичное число, каждая цифра которого представлена множеством двоичных цифр. Например, число 173.625 в двоично-десятичной системах счисления будет иметь вид: 1 7 3 . 6 2 5

0001 0111 0011

0110 0010 0101

Для целых чисел существуют два представления: беззнаковое (только для неотрицательных целых чисел) и со знаком. Очевидно, что отрицательные числа можно представлять только в знаковом виде.Различие в представлении целых чисел со знаком и без знака вызвано тем, что в ячейках одного и того же размера в беззнаковом типе можно представить больше различных положительных чисел, чем в знаковом.Например, в байте (8 разрядов) можно представить беззнаковые числа от 0 до 255.Максимальное число, записанное в восьми разрядах ячейки соответствует восьми единицам и равно:

111111112 = 1*27 + 1*26 + 1*25 + 1*24 + 1*23 + 1*22 + 1*21 + 1*20 = 255.

В ЭВМ в целях упрощения выполнения арифметических операций применяют специальные коды для представления чисел. Использование кодов позволяет свести операцию вычитания чисел к операции поразрядного сложения кодов этих чисел.Применяются прямой, обратный и дополнительный коды чисел.К кодам выдвигаются следующие требования:1) Разряды числа в коде жестко связаны с определенной разрядной сеткой.2) Для записи кода знака в разрядной сетке отводится фиксированный, строго определенный разряд. Прямой кодПрямой код двоичного числа совпадает по изображению с записью самого числа. Значение знакового разряда для положительных чисел равно 0, а для отрицательных чисел 1. Обратный кодОбратный код для положительного числа совпадает с прямым кодом.Для отрицательного числа все цифры числа заменяются на противоположные (1 на 0, 0 на 1), а в знаковый разряд заносится единица. Дополнительный кодДополнительный код положительного числа совпадает с прямым кодом. Для отрицательного числа дополнительный код образуется путем получения обратного кода и добавлением к младшему разряду единицы.

Итак, все целые отрицательные числа в компьютере представляются дополнительным кодом.

Ячейка памяти состоит из некоторого числа однородных элементов. Каждый элемент способен находиться в одном из двух состояний и служит для изображения одного из разрядов числа. Именно поэтому каждый элемент ячейки называют разрядом.

Нумерацию разрядов в ячейке принято вести справа налево, самый правый разряд имеет порядковый номер 0. Это младший разряд ячейки памяти, старший разряд имеет порядковый номер (n-1) в n-разрядной ячейке памяти.

Содержимым любого разряда может быть либо 0, либо 1.

12. Представление в памяти вещественных чисел: с фиксированной запятой и с плавающей запятой, достоинства и недостатки, мантисса, порядок, нормализованное представление, смещенный порядок, одинарная, двойная и расширенная точность, алгоритм перевода действительного числа в представление в памяти и наоборот.

ДИАПАЗОН ПРЕДСТАВЛЕНИЯ ВЕЩЕСТВЕННЫХ ЧИСЕЛ

ЧИСЛА С ФИКСИРОВАННОЙ ТОЧКОЙ

Такие числа могут быть как целыми, так и дробными. Точка мысленно фиксируется рядом с любым разрядом. Если она располагается справа от младшего бита, то число целое, если слева от старшего - число дробное. Далее будут рассматриваться только целые числа с фиксированной точкой, для нецелых чисел чаще применяется показательная форма, о которой пойдет речь дальше.

Естественным представлением целого неотрицательного числа является двоичная система счисления. Кодирование отрицательных чисел производится тремя наиболее употребительными способами, в каждом из которых крайний левый бит - знаковый. Отрицательному числу соответствует единичный бит, а положительному - нулевой. Каждый способ оценивается по скорости и затратам на выполнение сложения и изменения знака числа, т.к. вычитание есть сложение с измененным знаком одного операнда. 1.Прямой код. Изменение знака производится просто, путем инверсии бита знака. Пусть 00001001 = 9, тогда 10001001 = -9. Если при сложении двух чисел в этом коде знаки совпадают, то трудностей нет. Если знаки различаются необходимо найти наибольшее число, вычесть из него меньшее, а результату присвоить знак наибольшего слагаемого.

2.Обратный код, инверсный или дополнительный "до 1". Изменение знака производится просто - инверсией всех бит: 00001001 = 9, а 11110110 = -9. Сложение также выполняется просто, т.к. знаковые биты можно складывать. При переносе единицы из левого (старшего) бита, она должна складываться с правым (младшим).

Сложение в обратном коде происходит быстрее, т.к. не требуется принятие решения, как в предыдущем случае. Однако суммирование бита переноса требует дополнительных действий. Другим недостатком этого кода является представление нуля двумя способами, т.к. инверсия 0...00 равна 1. ..11 и сумма двух разных по знаку, но равных по значению чисел дает 1...11.Например: (00001001 = 9) + (11110110 = -9) = 11111111. Кстати, из этого примера понятно почему код называется дополнительным "до 1". Этих недостатков лишен --

3.Дополнительный или дополнительный "до 2" код. Число с противоположным знаком находится инверсией исходного и добавлением к результату единицы.

. ЧИСЛА С ПЛАВАЮЩЕЙ ТОЧКОЙ (ВЕЩЕСТВЕННЫЕ)

Вещественные числа хранятся и используются в ЭВМ в показательной форме, т.е. в виде двух составляющих: мантиссы и порядка. Различия в способах такого представления чисел заключаются в количестве байтов отводимых под порядок и мантиссу и небольших отличиях в форме их хранения. Например в четырехбайтовом формате под мантиссу отводится 3 байта и один байт для хранения порядка (КВ - короткий вещественный формат).

D = ±M * 2^(E-127)

Мантисса (от лат. mantissa — прибавка), дробная часть десятичного логарифма.

В этой главе принимается, что n=10 (десятичная система счисления).

На компьютере (в частности в тексте компьютерных программ) экспоненциальную запись записывают в виде MEp, где:

M — мантисса,

E (exponent) — буква E, означающая «*10^» («…умножить на десять в степени…»).

p — порядок,

Число с плавающей запятой состоит из набора отдельных разрядов, условно разделенных на знак, экспоненту порядок и мантиссу. Порядок и мантисса — целые числа, которые вместе со знаком дают представление числа с плавающей запятой в следующем виде:

Порядок – это степень базы (двойки) старшего разряда. В нашем случае E=2. Такие числа удобно записывать в так называемом «научном» стандартном виде, например «1.01e+2».

Поэтому уже в самых первых машинах числа представляли в так называемом нормализованном виде, когда первый бит мантиссы всегда подразумевался равным единице.если целая часть мантиссы числа состоит из одной, не равной нулю, цифры, то число с плавающей точкой называется нормализованным.

Числа двойной точности занимают в памяти 8 байт, что составляет два 32-битных слова.

Числа одинарной точности занимают в памяти 32 бита: один бит знака, восемь битов для порядка со смещением и 23 бита мантиссы с подразумеваемой ведущей единицей.

Таким образом, из вышесказанного вытекает следующий алгоритм для получения представления действительного числа в памяти ЭВМ:

перевести модуль данного числа в двоичную систему счисления;

нормализовать двоичное число, т.е. записать в виде M × 2p, где M — мантисса (ее целая часть равна 1(2)) и p — порядок, записанный в десятичной системе счисления;

прибавить к порядку смещение и перевести смещенный порядок в двоичную систему счисления;

учитывая знак заданного числа (0 — положительное; 1 — отрицательное), выписать его представление в памяти ЭВМ.

13. Представление символьных данных: код символа, алфавит, методы записи текстовой строки в память, форматирование, текстовые метки, кодовая таблица ASCII, стандарт UNICODE

СИМВОЛЬНЫЕ – используются для обозначения понятий, объектов и формирования текстов по правилам того или иного языка сообщений.

При представлении СИМВОЛЬНЫХ данных один байт представляет собой кодированное представление одного символа, например:

01001110 - код буквы N, 01000101 - код буквы Е

Байтом можно представить 256 различных символов. Для такого представления используется стандартная таблица ASCII (читается аски). В этой таблице первые 128 кодовых комбинаций являются общими для всех стран, а последние 128 кодов символов используются в различных языках, в частности русском. Каждому символу таблицы ASCII соответствует свой и только свой код. Юнико́д[1] или Унико́д[2] (англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.[3

Форматирование текста

Операции форматирования включают в себя разбивку текста на строки (в рамках абзаца) и страницы, выбор расположения абзацев, отступов и отбивок между абзацами, обтекания отдельных абзацев, а также видов и начертаний шрифтов. Эти операции выполняются различными текстовыми процессорами с разной степенью автоматизации. Суть форматирования заключается в способности текстового процессора изменять оформление документа на странице, а именно:

— изменять границы рабочего поля, определяя поля сверху, снизу, слева, справа;

— устанавливать межстрочный интервал (разреженность строк на странице) и межбуквенный интервал в слове;

— выравнивать текст — центрировать, прижимать к левой или правой границе;

— равномерно распределять слова в строке;

— использовать разные шрифты и т. п.

Форматирование текста. При редактировании документа изменяется его содержание, а при форматировании — его внешний вид. В текстовых редакторах различают форматирование символов и форматирование абзацев.

При форматировании символов, как правило, задаются параметры шрифта: гарнитура, размер, начертание, тип подчеркивания и прочее.

14. Представление звуковых данных: звук, процесс сохранения и воспроизведения звука, дискретизация сигнала по времени и по уровню, частота дискретизации, квантование, теорема Найквиста.

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон. Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Частота временной дискретизации

- это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров:

11 кГц, 22 кГц, 44,1 кГц и др.

Частота дискретизации (или частота семплирования, англ. sample rate) — частота взятия отсчетов непрерывного во времени сигнала при его дискретизации (в частности, аналого-цифровым преобразователем). Измеряется в Герцах.

Квантование (англ. quantization) — в информатике разбиение диапазона значений непрерывной или дискретной величины на конечное число интервалов. Существует также векторное квантование — разбиение пространства возможных значений векторной величины на конечное число областей. Простейшим видом квантования является деление целочисленного значения на натуральное число, называемое коэффициентом квантования.

При дискретизации изменяющаяся во времени величина (сигнал) замеряется с заданной частотой (частотой дискретизации), таким образом, дискретизация разбивает сигнал по временной составляющей (на графике — по горизонтали). Квантование же приводит сигнал к заданным значениям, то есть, разбивает по уровню сигнала (на графике — по вертикали). Сигнал, к которому применены дискретизация и квантование, называется цифровым.

Квантование часто используется при обработке сигналов, в том числе при сжатии звука и изображений.

Квантование по уровню — представление величины отсчётов цифровыми сигналами. Для квантования в двоичном коде диапазон напряжения сигнала от до делится

на интервалов. Величина получившегося интервала (шага квантования):

Каждому интервалу присваивается -разрядный двоичный код — номер интервала, записанный двоичным числом. Каждому отсчёту сигнала присваивается код того интервала, в который попадает значение напряжения этого отсчёта. Таким образом, аналоговый сигнал представляется последовательностью двоичных чисел, соответствующих величине сигнала в определённые моменты времени, то есть цифровым сигналом. При этом каждое двоичное число представляется последовательностью импульсов высокого (1) и низкого (0) уровня.

Преобразование непрерывного информационного множества аналоговых сигналов в дискретное множество называется дискретизацией или квантован НАЙКВИСТА ФОРМУЛА (теорема Найквиста)

НАЙКВИСТА ФОРМУЛА (теорема Найквиста), соотношение, определяющее величину тепловых флуктуаций тока или напряжения в электрич. цепи. Получено амер. физиком X. Найквистом (Н. Nyquist) в 1928. Согласно Н. ф., обусловленное тепловыми флуктуациями ср. значение квадрата напряжений на концах проводника с сопротивлением R, находящегося в состоянии теплового равновесия при абс. темп-ре Т, равно:

V2 = 4RkTDv, (1)

где Dv — полоса частот, внутри к-рой измеряются флуктуации напряжения. При низких темп-pax и достаточно высоких частотах v, когда hv³kT, вместо формулы (1) пользуются более общим выражением: ием по уровню.

15. Представление графических данных: векторная и растровая графика, модель RGB, закон трехмерности, непрерывности и аддитивности, принцип декомпозиции, аддивная и субтрактивная модель, модель CMYK, оцифровка изображения, режимы TrueColor и HighColor

Компьютерная графика – это наука, предметом изучения которой является создание, хранение и обработка моделей и их изображений с помощью ЭВМ, т.е. это раздел информатики, который занимается проблемами получения различных изображений (рисунков, чертежей, мультипликации) на компьютере.Под компьютерной графикой обычно понимают автоматизацию процессов подготовки, преобразования, хранения и воспроизведения графической информации с помощью компьютера. Под графической информацией понимаются модели объектов и их изображения.Векторная графика (другое название - геометрическое моделирование) - это использование геометрических примитивов, таких как точки, линии, сплайны и многоугольники, для представления изображений в компьютерной графике. Термин используется в противоположность к растровой графике, которая представляет изображения как матрицу пикселей (точек).

.Растровое изображение, цифровое изображение - это файл данных или структура, представляющая прямоугольную сетку пикселей или точек цветов на компьютерном мониторе, бумаге и других отображающих устройствах и материалах. То есть, растровая графика - это формат изображения, который содержит информацию о расположении, количестве и цвете пикселей.Главным достоинством растровой графики является создание (воспроизведение) практически любого рисунка, вне зависимости от сложности, в отличие, например, от векторной, где невозможно точно передать эффект перехода от одного цвета к другому (в теории, конечно, возможно, но файл размером 1 МБ в формате BMP будет иметь размер 200 МБ в векторном формате).RGB (аббревиатура английских слов Red, Green, Blue — красный, зелёный, синий) — аддитивная цветовая модель, как правило, описывающая способ синтеза цвета для цветовоспроизведения.Выбор основных цветов обусловлен особенностями физиологии восприятия цвета сетчаткой человеческого глаза. Цветовая модель RGB нашла широкое применение в технике.Аддитивной она называется потому, что цвета получаются путём добавления (англ. addition) к черному. ЗАКОНЫ СИНТЕЗА ЦВЕТА законы, являющиеся базой научной теории о синтезе цвета. Сформулированы Г. Грассманом в 1853 г. З. с. ц. включают в себя: 1) "закон трехмерности" любой цвет однозначно выражается тремя цветами, если они линейно независимы (линейная независимость заключается в том, что нельзя получить никакой из указанных трех цветов сложением двух остальных); 2) "закон непрерывности" при непрерывном изменении излучения цвет изменяется также непрерывно (не существует такого цвета, к которому невозможно было бы подобрать бесконечно близкий); 3) "закон аддитивности" цвет смеси излучений зависит только от их цветов, но не от спектрального состава. Все три закона наглядно проявляются в процессе синтеза цветных полутоновых изображений на оттиске с использованием любого из способов печати. Цветовая модель CMYKСистема цветов CMYK была широко известна задолго до того, как компьютеры стали использоваться для создания графических изображений. Триада основных печатных цветов: голубой, пурпурный и желтый (CMY, без черного) является, по сути, наследником трех основных цветов живописи (синего, красного и желтого). Изменение оттенка первых двух связано с отличным от художественных химическим составом печатных красок, но принцип смешения тот же самый. Система CMYK создана и используется для печати. Все файлы, предназначенные для вывода в типографии, должны быть конвертированы в CMYK. Этот процесс называется цветоделением. Оцифровка изображения Перевод изображения из аналогового вида в цифровой для последующей обработки. Оцифровка изображения, как правило, используется в типографиях и в организациях, оказывающих услуги по полиграфии. Полученное цифровое изображения готово для использования в специальных компьютерных программах и распечатки. Оцифровка изображения необходима, чтобы создавать полноценную высококачественную полиграфическую продукцию: буклеты, газеты, открытки, календари, плакаты, журналы, флаеры, лифлеты и т.д. Когда осуществляется оцифровка книг и ее возможно многочисленных иллюстраций, то после процесса сканирования, необходим этап распознавания, осуществляемый на компьютере. Это значительно экономит временные ресурсы, которые могли быть потрачены на набор больших объемов текста. При оцифровке изображения очень важно учитывать качество будущего файла. Параметры задаются при обработке аналогового изображения с помощью сканера. Это устройство захватывает выбранный объект и сохраняет его как файл. Далее данный файл может быть подвергнут редактированию, корректировке, изменению размеров, цветовой гаммы и т.д. Можно также создавать коллажи. В процессе сканирования особое внимание стоит обратить на расширение файла с изображением.Хотя в принципе мониторы и могут отображать любой из более чем 16 миллионов цветов RGB, на практике это зависит от того, как настроены свойства дисплея на вашем компьютере. В Windows традиционно доступны три главных цветовых режима (хотя некоторые машины могут предлагать и другие опции, в зависимости от установленного оборудования): true color (реалистичное цветовоспроизведение, 24 бита), high color (высококачественное цветовоспроизведение, 16 бит) и 256 цветов. (На некоторых графических картах в наши дни true color называется 32-битным режимом. Это сделано с целью оптимизации работы оборудования, хотя в этом случае для представления цветов используются лишь 24 бита из 32.)Только режим true color позволяет отображать все цвета RGB одновременно. Это кажется лучшим выбором, но обходится недешево: для представления полного значения RGB требуется 3 байта - т.е. 3 байта памяти графической карты необходимы для хранения одного отображаемого пикселя. Если на первом месте стоит экономия видеопамяти (ограничение, которое теперь не так часто используется, как следовало бы), то вы можете предпочесть один из других режимов. Режим high-color требует 2 байта на пиксель. Этого достаточно, чтобы выделить 5 бит на каждый компонент RGB.. Палитра перечисляет 256 цветов, выбранных из 16 миллионов цветов RGB.

16. Сжатие информации: избыточность, примеры избыточности, устранение избыточности, обратимые и необратимые методы, коэффициент сжатия, метод упаковки, метод Хаффмана, метод RLE, алгоритм Лемпеля-Зива, алгоритмы с частичной потерей данных, регулируемая потеря информации, форматы сжатых файлов.

Сжатие данных (англ. data compression) — алгоритмическое преобразование данных, производимое с целью уменьшения их объёма. Применяется для более рационального использования устройств хранения и передачи данных. Синонимы — упаковка данных, компрессия, сжимающее кодирование, кодирование источника. Обратная процедура называется восстан

9Избыточность — термин из теории информации, означающий превышение количества информации, используемой для передачи или хранения сообщения, над его информационной энтропией. Для уменьшения избыточности применяется сжатие данных без потерь, в то же время контрольная сумма применяется для внесения дополнительной избыточности в поток, что позволяет производить исправление ошибок при передаче информации по каналам, вносящим искажения (спутниковая трансляция, беспроводная передача и т. д.). овлением данных (распаковкой, декомпрессией).

Сжатие информации без потерь - способ сжатия информации, при котором описывающий ее исходный код может быть восстановлен без искажений.

Коэффициент сжатия — основная характеристика алгоритма сжатия, выражающая основное прикладное качество. Она определяется как отношение размера несжатых данных к сжатым, то есть:

k = So/Sc,

где k — коэффициент сжатия, So — размер несжатых данных, а Sc — размер сжатых. Таким образом, чем выше коэффициент сжатия, тем алгоритм лучше. Следует отметить:

если k = 1, то алгоритм не производит сжатия, то есть получает выходное сообщение размером, равным входному;

если k < 1, то алгоритм порождает при сжатии сообщение большего размера, нежели несжатое, то есть, совершает „вредную“ работу.

Коэффициент сжатия может быть как постоянным коэффициентом (некоторые алгоритмы сжатия звука, изображения и т. п., например А-закон, μ-закон, ADPCM), так и переменным. Во втором случае он может быть определён либо для какого либо конкретного сообщения, либо оценён по некоторым критериям:

среднее (обычно по некоторому тестовому набора данных);

максимальное (случай наилучшего сжатия);

минимальное (случай наихудшего сжатия);

или каким либо другим. Коэффициент сжатия с потерями при этом сильно зависит от допустимой погрешности сжатия или его качества, которое обычно выступает как параметр алгоритма.

Допустимость потерь

Основным критерием различия между алгоритмами сжатия является описанное выше наличие или отсутствие потерь. В общем случае алгоритмы сжатия без потерь универсальны в том смысле, что их можно применять на данных любого типа, в то время как применение сжатия потерь должно быть обосновано. Некоторые виды данных не приемлят каких бы то ни было потерь:

символические данные, изменение которых неминуемо приводит к изменению их семантики: программы и их исходные тексты, двоичные массивы и т. п.;

жизненно важные данные, изменения в которых могут привести к критическим ошибкам: например, получаемые с медицинской измерительной техники или контрольных приборов летательных, космических аппаратов и т. п.

данные, многократно подвергаемые сжатию и расжатию: рабочие графические, звуковые, видеофайлы.

Однако сжатие с потерями позволяет добиться гораздо больших коэффициентов сжатия за счёт отбрасывания незначащей информации, которая плохо сжимается. Так, например алгоритм сжатия звука без потерь FLAC, позволяет в большинстве случаев сжать звук в 1,5—2,5 раза, в то время как алгоритм с потерями Vorbis, в зависимости от установленного параметра качетсва может сжать до 15 раз с сохранением приемлемого качества звучания.

Метод Хаффмана (Huffman method)

Сжатие Хаффмана - статистический метод сжатия, который уменьшает среднюю длину кодового слова для символов алфавита. Код Хаффмана является примером кода, оптимального в случае, когда все вероятности появления символов в сообщении - целые отрицательные степени двойки. Код Хаффмана может быть построен по следующему алгоритму:

Выписываем в ряд все символы алфавита в порядке возрастания или убывания вероятности их появления в тексте;

Последовательно объединяем два символа с наименьшими вероятностями появления в новый составной символ, вероятность появления которого полагается равной сумме вероятностей составляющих его символов; в конце концов мы построим дерево, каждый узел которого имеет суммарную вероятность всех узлов, находящихся ниже него;

Прослеживаем путь к каждому листу дерева помечая направление к каждому узлу (например, направо - 1, налево - 0).

Одним из простейший способов сжатия является метод RLE (Run Length Encoding - кодирование с переменной длиной строки). Действие метода RLE заключается в поиске одинаковых пикселов в одной строке. Если в строке, допустим, имеется 3 пиксела белого цвета, 21 - черного, затем 14 - белого, то применение RLE дает возможность не запоминать каждый из них (38 пикселов), а записать как 3 белых, 21 черный и 14 белых в первой строке.

Алгоритм Лемпеля — Зива — Велча

Описание

Данный алгоритм при сжатии (кодировании) динамически создаёт таблицу преобразования строк: определённым последовательностям символов (словам) ставятся в соответствие группы бит фиксированной длины (обычно 12-битные). Таблица инициализируется всеми 1-символьными строками (в случае 8-битных символов — это 256 записей). По мере кодирования, алгоритм просматривает текст символ за символом, и сохраняет каждую новую, уникальную 2-символьную строку в таблицу в виде пары код/символ, где код ссылается на соответствующий первый символ. После того как новая 2-символьная строка сохранена в таблице, на выход передаётся код первого символа. Когда на входе читается очередной символ, для него по таблице находится уже встречавшаяся строка максимальной длины, после чего в таблице сохраняется код этой строки со следующим символом на входе; на выход выдаётся код этой строки, а следующий символ используется в качестве начала следующей строки.

Алгоритму декодирования на входе требуется только закодированный текст, поскольку он может воссоздать соответствующую таблицу преобразования непосредственно по закодированному тексту.

Алгоритм

Инициализация словаря всеми возможными односимвольными фразами. Инициализация входной фразы w первым символом сообщения.

Найти в словаре строку W наибольшей длины, которая совпадает с последними принятыми символами.

Считать очередной символ K из кодируемого сообщения.

Если КОНЕЦ_СООБЩЕНИЯ, то выдать код для W, иначе

Если фраза WK уже есть в словаре, присвоить входной фразе W значение WK и перейти к Шагу 3, иначе выдать код W, добавить WK в словарь, присвоить входной фразе W значение K и перейти к Шагу 3.

Конец

17. Основы теории множеств: множество (М), элемент М, универсальное М, подмножество, равенство М, мощность М, методы задания М, объединение, пересечение, разность, симметричная разность, дополнение.

Тео́рия мно́жеств — раздел математики, в котором изучаются общие свойства множеств. Теория множеств лежит в основе большинства математических дисциплин; она оказала глубокое влияние на понимание предмета самой математики.

Множество - это совокупность, класс отличающихся друг от друга объектов, объединенных каким-либо общим свойством. Объекты, входящие в эту совокупность, называются элементами множества.

Множества обозначаются заглавными буквами латинского алфавита , а элементы множества- строчными.

Приведем примеры множеств.

Классы (множества) чисел: N – натуральные числа, Z – целые числа, Q- рациональные числа, R- действительные (вещественные) числа, C – комплексные числа.

Если U – универсальное множество некоторой теории, то любое множество этой теории является его подмножеством. Например, множество комплексных чисел С – универсальное множество в теории чисел. Для всех классов чисел можно построить цепочку включений: N  Z  Q  R  C.

Подмножество множества А (математическое), любое множество, каждый элемент которого принадлежит А. Например, множество всех чётных чисел является П. множества всех целых чисел. Если к числу множеств причислить "пустое" множество, совсем не содержащее элементов, то, в силу определения, его следует считать П. любого другого множества. Само множество А и пустое множество называются иногда несобственными П., остальные же П. — собственными.

Множества А и В называются равными, если А  В и В  А.

Обозначение: А = В.

Разностью множеств А и В называется множество, обозначаемое через А\В и состоящее из тех и только из тех элементов, которые принадлежат А и не принадлежат В.

Симметрической разностью множеств А и В называется множество, обозначаемое АВ и состоящее из тех и только из тех элементов, которые принадлежат А\В или В\А.

Объединением (суммой0 множеств А и В называется множество, обозначаемое через АВ, содержащее те и только те элементы, которые принадлежат множеству А или В.

18. Основы алгебры логики: простое и сложное высказывание, таблица истинности, логические операции, отрицание, конъюнкция, дизъюнкция, импликация, эквиваленция, исключающее ИЛИ.

Алгеброй логики называется аппарат, который позволяет выполнять действия над высказываниями.

Алгебру логику называют также алгеброй Буля, или булевой алгеброй, по имени английского математика Джорджа Буля, разработавшего в XIX веке ее основные положения. В булевой алгебре высказывания принято обозначать прописными латинскими буквами: A, B, X, Y. В алгебре Буля введены три основные логические операции с высказываниями? Сложение, умножение, отрицание. Определены аксиомы (законы) алгебры логики для выполнения этих операций. Действия, которые производятся над высказываниями, записываются в виде логических выражений.

Логические выражения могут быть простыми и сложными.

Простое логическое выражение состоит из одного высказывания и не содержит логические операции. В простом логическом выражении возможно только два результата — либо «истина», либо «ложь».

Сложное логическое выражение содержит высказывания, объединенные логическими операциями. По аналогии с понятием функции в алгебре сложное логическое выражение содержит аргументы, которыми являются высказывания.

В качестве основных логических операций в сложных логических выражениях используются следующие:

НЕ (логическое отрицание, инверсия);

ИЛИ (логическое сложение, дизъюнкция);

И (логическое умножение, конъюнкция).

Логическое отрицание является одноместной операцией, так как в ней участвует одно высказывание. Логическое сложение и умножение — двуместные операции, в них участвует два выска¬зывания. Существуют и другие операции, например операции следования и эквивалентности, правило работы которых можно вывести на основании основных операций.

Операция И — логическое умножение (конъюнкция)

Логическая операция И выполняет функцию пересечения двух высказываний (аргументов), в качестве которых может быть и простое, и сложное логическое выражение. Результатом операции И является выражение, которое будет истинным тогда и только тогда, когда истинны оба исходных выражения.

Применяемые обозначения: А и В, А Λ В, A & B, A and B.

Результат операции И определяется следующей таблицей истинности:

A B А и B

0 0 0

0 1 0

1 0 0

1 1 1

Результат операции И истинен тогда и только тогда, когда истинны одновременно высказывания А и В, и ложен во всех остальных случаях.

Операция ИЛИ — логическое сложение (дизъюнкция, объединение)

Логическая операция ИЛИ выполняет функцию объединения двух высказываний, в качестве которых может быть и простое, и сложное логическое выражение. Высказывания, являющиеся исходными для логической операции, называют аргументами. Результатом операции ИЛИ является выражение, которое бу¬дет истинным тогда и только тогда, когда истинно будет хотя бы одно из исходных выражений.

Применяемые обозначения: А или В, А V В, A or B.

Результат операции ИЛИ опреде¬ляется следующей таблицей истинности:

A B А или B

0 0 0

0 1 1

1 0 1

1 1 1

Результат операции ИЛИ истинен, когда истинно А, либо истинно В, либо истинно и А и В одновременно, и ложен тогда, когда аргументы А и В — ложны.

Операция «ЕСЛИ-ТО» — логическое следование (импликация)

Эта операция связывает два простых логических выражения, из которых первое является условием, а второе — следствием из этого условия.

Применяемые обозначения:

если А, то В; А влечет В; if A then В; А→ В.

Таблица истинности:A B А → B

0 0 1

0 1 1

1 0 0

1 1 1

Результат операции следования (импликации) ложен только тогда, когда предпосылка А истинна, а заключение В (следствие) ложно.

Операция «А тогда и только тогда, когда В» (эквивалентность, равнозначность)

Применяемое обозначение: А ↔ В, А ~ В.

Таблица истинности:A B А↔B

0 0 1

0 1 0

1 0 0

1 1 1

Результат операции эквивалентность истинен только тогда, когда А и В одновременно истинны или одновременно ложны.

Сложе́ние по модулю 2 (исключа́ющее «ИЛИ», XOR, «сумма по модулю 2») — логическая операция, по своему применению максимально приближенная к грамматической конструкции «либо … либо …».

19. Основы алгебры логики: логическая формула, выполнимая формула, тавтология, противоречие, таблица истинности, алгоритм ее построения, примеры, приоритеты операций.

ражение в языке формальной логики, являющееся аналогом предложения. Точное определение Л. ф. дается для каждого конкретного логич. языка. Как правило, определение формулы имеет индуктивный характер: выделяется класс выражений, называемых элементарными, или атомарными, формулами, и указываются правила, позволяющие из уже построенных формул строить новые формулы, используя символы логических операций. Напр., формулы логики высказываний определяются следующим образом. Всякая пропозициональная переменная есть (элементарная) формула

Формула А называется выполнимой, если она принимает значения и 0 и 1.

Например, формула ху выполнимая.

Между понятиями равносильности и эквивалентности существует следующая связь: если формулы А и В равносильны, то формула А  В - тавтология, и обратно, если формула А  В — тавтология, то формулы А и В равносильны.

Все формулы алгебры логики можно подразделить на три класса: тавтологии, тождественно ложные и выполнимые.

Формула А называется тождественно истинной (или тавтологией) , если она принимает значение 1 при всех значениях входящих в нее переменных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]