Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
вопрос 1 ит.docx
Скачиваний:
2
Добавлен:
16.04.2019
Размер:
158.8 Кб
Скачать

Информатика - наука о способах получения, накопления, хранения, преобразования, передачи, защиты и использования информации. Она включает дисциплины, относящиеся к обработке информации в вычислительных машинах и вычислительных сетях: как абстрактные, вроде анализа алгоритмов, так и довольно конкретные, например, разработка языков программирования.

Термин информатика возник в 60-х годах во Франции для названия области, занимающейся автоматизированной переработкой информации, как слияние французских слов information и automatique.

Термин «информатика» был впервые введён в Германии Карлом Штейнбухом в 1957 году[2]. В 1962 году этот термин был введён во французский язык Ф. Дрейфусом, который также предложил переводы на ряд других европейских языков. В советской научно-технической литературе термин «информатика» был введён А. И. Михайловым, А. И. Черным и Р. С. Гиляревским в 1968 году[3].

Отдельной наукой информатика была признана лишь в 1970-х; до этого она развивалась в составе математики, электроники и других технических наук. Некоторые начала информатики можно обнаружить даже в лингвистике. С момента своего признания отдельной наукой информатика разработала собственные методы и терминологию.

Первый факультет информатики был основан в 1962 году в университете Пёрдью (Purdue University). Сегодня факультеты и кафедры информатики имеются в большинстве университетов мира.

В школах СССР учебная дисциплина «Информатика» появилась в 1985 году одновременно с первым учебником А. П. Ершова «Основы информатики и вычислительной техники».

Высшей наградой за заслуги в области информатики является премия Тьюринга.

4 декабря отмечается День российской информатики, так как в этот день в 1948 году Государственный комитет Совета министров СССР по внедрению передовой техники в народное хозяйство зарегистрировал за номером 10 475 изобретение И. С. Брука и Б. И. Рамеева — цифровую электронную вычислительную машину

Впервые понятие информации было сформулировано Н.Винером, полагавшим, что все явления в природе охватываются тремя основными понятиями: вещество, энергия, информация. В отличие от Н.Винера, не рассматривавшего взаимосвязь этих компонентов, многие современные авторы тесно увязывают их и рассматривают как единую систему.

Термин «информация» происходит от латинского слова «information» -разъяснение, изложение, осведомленность.

Однако определение этого понятия в разных областях дано по-разному. Например, несколько гуманитарных определений понятия «информация»:

  • информация - сведения, передаваемые одними людьми другим людям устным, письменным или каким-нибудь другим способом [БСЭ, 1980];

  • информация - содержание сообщения или сигнала; сведения, рассматриваемые в процессе их передачи или восприятия, позволяющие расширить знания об интересующем объекте [Терминологический словарь, 1991].

В экономике информацию рассматривают как сведения, которые необходимо фиксировать, передавать, хранить и обрабатывать для использования в управлении как хозяйством страны в целом, так и отдельными его объектами.

С правовой точки зрения информация определяется как «некоторая совокупность различных сообщений о событиях, происходящих в правовой системе общества, ее подсистемах и элементах и во внешней по отношению к данным правовым информационным образованиям среде, об изменениях характеристик информационных образований и внешней среды, или как мера организации социально-экономических, политических, правовых, пространственных и временных факторов объекта. Она устраняет в правовых информационных образованиях, явлениях и процессах неопределенность и обычно связана с новыми, ранее неизвестными нам явлениями и фактами».

В естественных науках информация выступает в качестве меры сложности структур (Моль) и меры разнообразия (Эшби): чем выше упорядоченность (организованность) системы (объекта), тем больше в ней содержится «связанной» информации.

В физике информация определяется как отрицание энтропии - меры неопределенности, учитывающей вероятность появления тех или иных сообщений (Бриллюэн).

В генетике понятие информации определяется как программа (генетический код) биосинтеза белков, материально представленная полимерными цепочками ДНК.

При оценке информации различают ее синтаксический, семантический и прагматический аспекты.

Синтаксический аспект касается формальной правильности сообщения с точки зрения синтаксических правил используемого языка безотносительно к его содержанию.

Семантический аспект передает смысловое содержание информации и соотносит её с ранее имевшейся информацией. Знания об определенной предметной области фиксируются в форме тезауруса, то есть совокупности понятий и связей между ними. При получении информации тезаурус может изменяться. Степень этого изменения характеризует воспринятое количество информации. Семантический аспект определяет возможность достижения поставленной цели с учетом полученной информации, т.е. определяет ценность информации.

Количество информации, содержащейся в некотором сообщении, можно оценить степенью изменения индивидуального тезауруса получателя под воздействием данного сообщения. Иными словами, количество информации, извлекаемой получателем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации. Если индивидуальный тезаурус получателя сообщения не пересекается с тезаурусом отправителя, то получатель не понимает сообщение и для него количество принятой информации равно нулю. Такая ситуация аналогична прослушиванию сообщения на неизвестном языке. Несомненно, что сообщение не лишено смысла, однако оно непонятно, а значит, не информативно. Если тезаурусы отправителя и получателя совпадают, то количество информации в сообщении также будет равно нулю, поскольку его получатель знает абсолютно всё о предмете. В этом случае сообщение не дает ему ничего нового. Сообщение несет информацию для получателя только в том случае, когда их тезаурусы пересекаются частично.

Человек сначала наблюдает некоторые факты, которые отображаются в виде набора данных. Здесь проявляется синтаксический аспект. Затем после структуризации этих данных формируется знание о наблюдаемых фактах, которое фиксируется на некотором языке. Это семантический аспект информации. Полученное знание и созданные на его основе информационные модели человек использует в своей практике для достижения поставленных целей.

В реальной жизни часто возникает ситуация, когда даже наличие полной информации не позволяет решить поставленную задачу.

Прагматический аспект информации проявляется в возможности её практического использования.

Таким образом, не любое сообщение несет информацию. Для того чтобы сообщение несло некоторую информацию, и было полезно получателю, оно должно быть:

записано на некотором языке;

этот язык должен быть понятен получателю;

получатель должен обладать методом извлечения информации из сообщения;

сообщение должно снижать степень неопределенности относительно объекта, который интересует получателя;

сообщение должно помогать ему решить поставленную задачу;

получатель должен обладать реальной практической возможностью использовать полученную информацию.

Как и всякий объект, информация обладает свойствами. Характерной отличительной особенностью информации от других объектов природы и общества, является дуализм: на свойства информации влияют как свойства исходных данных, составляющих ее содержательную часть, так и свойства методов, фиксирующих эту информацию. С точки зрения информатики наиболее важными представляются следующие общие качественные свойства: объективность, достоверность, полнота, точность, актуальность, полезность, ценность, своевременность, понятность, доступность, краткость и пр.

  1. Объективность информации. Объективный – существующий вне и независимо от человеческого сознания. Информация – это отражение внешнего объективного мира. Информация объективна, если она не зависит от методов ее фиксации, чьего-либо мнения, суждения. Пример. Сообщение «На улице тепло» несет субъективную информацию, а сообщение «На улице 22°С» – объективную, но с точностью, зависящей от погрешности средства измерения. Объективную информацию можно получить с помощью исправных датчиков, измерительных приборов. Отражаясь в сознании человека, информация может искажаться (в большей или меньшей степени) в зависимости от мнения, суждения, опыта, знаний конкретного субъекта, и, таким образом, перестать быть объективной.

  2. Достоверность информации. Информация достоверна, если она отражает истинное положение дел. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Достоверная информация помогает принять нам правильное решение. Недостоверной информация может быть по следующим причинам:

    • преднамеренное искажение (дезинформация) или непреднамеренное искажение субъективного свойства;

    • искажение в результате воздействия помех («испорченный телефон») и недостаточно точных средств ее фиксации.

  3. Полнота информации. Информацию можно назвать полной, если ее достаточно для понимания и принятия решений. Неполная информация может привести к ошибочному выводу или решению.

  4. Точность информации определяется степенью ее близости к реальному состоянию объекта, процесса, явления и т. п.

  5. Актуальность информации – важность для настоящего времени, злободневность, насущность. Только вовремя полученная информация может быть полезна.

  6. Полезность (ценность) информации. Полезность может быть оценена применительно к нуждам конкретных ее потребителей и оценивается по тем задачам, которые можно решить с ее помощью.

Самая ценная информация – объективная, достоверная, полная, и актуальная. При этом следует учитывать, что и необъективная, недостоверная информация (например, художественная литература), имеет большую значимость для человека. Социальная (общественная) информация обладает еще и дополнительными свойствами:

  • имеет семантический (смысловой) характер, т. е. понятийный, так как именно в понятиях обобщаются наиболее существенные признаки предметов, процессов и явлений окружающего мира.

  • имеет языковую природу (кроме некоторых видов эстетической информации, например изобразительного искусства). Одно и то же содержание может быть выражено на разных естественных (разговорных) языках, записано в виде математических формул и т. д.

С течением времени количество информации растет, информация накапливается, происходит ее систематизация, оценка и обобщение. Это свойство назвали ростом и кумулированием информации. (Кумуляция – от лат. cumulatio – увеличение, скопление).

Старение информации заключается в уменьшении ее ценности с течением времени. Старит информацию не само время, а появление новой информации, которая уточняет, дополняет или отвергает полностью или частично более раннюю. Научно-техническая информация стареет быстрее, эстетическая (произведения искусства) – медленнее.

Логичность, компактность, удобная форма представления облегчает понимание и усвоение информации.

компьютер воспринимает всю информацию через нули и единички. Бит – это минимальная единица измерения информации, соответствующая одной двоичной цифре («0» или «1»).

Байт состоит из восьми бит. Используя один байт, можно закодировать один символ из 256 возможных (256 = 28). Таким образом, один байт равен одному символу, то есть 8 битам:

1 символ = 8 битам = 1 байту.

Изучение компьютерной грамотности предполагает рассмотрение и других, более крупных единиц измерения информации.

Таблица байтов:

1 байт = 8 бит

1 Кб (1 Килобайт) =  210 байт = 2*2*2*2*2*2*2*2*2*2 байт =

= 1024 байт (примерно 1 тысяча байт – 103 байт)

1 Мб (1 Мегабайт) = 220 байт = 1024 килобайт (примерно 1 миллион байт – 106 байт)

1 Гб (1 Гигабайт) =   230 байт = 1024 мегабайт (примерно 1 миллиард байт – 109 байт)

1 Тб (1 Терабайт) =    240 байт = 1024 гигабайт (примерно 1012 байт). Терабайт иногда называют тонна.

1 Пб (1 Петабайт) =   250 байт = 1024 терабайт (примерно 1015 байт).

1 Эксабайт =              260 байт = 1024 петабайт (примерно 1018 байт).

1 Зеттабайт =            270 байт = 1024 эксабайт (примерно 1021 байт).

1 Йоттабайт =           280 байт = 1024 зеттабайт (примерно 1024 байт).

В приведенной выше таблице степени двойки (210, 220, 230 и т.д.) являются точными значениями килобайт, мегабайт, гигабайт. А вот степени числа 10 (точнее, 103, 106, 109 и т.п.) будут уже приблизительными значениями, округленными в сторону уменьшения. Таким образом, 210 = 1024 байта представляет точное значение килобайта, а 103 = 1000 байт является приблизительным значением килобайта. Такое приближение (или округление) вполне допустимо и является общепринятым.

Носители информации

Допечатные процессы предъявляют особые требования к регистрирующим средствам, использующимся для хранения информации. Такие требования являются следствием не только постоянных потребностей, связанных с увеличением объемов сохраняемых данных, обрабатываемых в процессе производства печатной продукции. Память имеет исключительное значение для постоянного резервирования данных внутри сети рабочих станций, а также для безопасной пересылки и архивирования данных. Несмотря на возросшие возможности передачи данных через сети или через Интернет, среды для сохранения данных будут продолжать играть важную роль в обмене информацией между заказчиком и исполнителем.

Благодаря новым технологиям и производственным процессам емкость носителей, предназначенных для хранения информации, постоянно увеличивается. Имеются предпосылки, что этот рост составит около 80% в год. Суть увеличения объемов хранения данных включает, вероятно, совокупность следующих факторов: повышение плотности записи, числа дорожек и оптимальное использование поверхности носителя. Супердиск с объемом памяти 120 Мб действительно соответствует данной задаче, несмотря на то, что по внешнему виду он является почти таким же, как гибкий 3,5-дюймовый диск. Однако супердиск по объему памяти превосходит последний почти в 83 раза. Сведения об объемах памяти различных носителей приведены в табл. 5.

Классификация носителей данных

Все имеющиеся в настоящее время носители информации могут подразделяться по различным признакам. В первую очередь, следует различать энергозависимые и энергонезависимые накопители информации.

Энергонезависимые накопители, используемые для архивирования и сохранения массивов данных, подразделяют:

  • по виду записи: – магнитные накопители (жесткий диск, гибкий диск, сменный диск); – магнитно-оптические системы, называемые также МО; – оптические, такие, как CD (Compact Disk, Read Only Memory) или DVD (Digital Versatile Disk);

  • по способам построения: – вращающаяся пластина или диск (как у жесткого диска, гибкого диска, сменного диска, CD, DVD или MО); – ленточные носители различных форматов; – накопители без подвижных частей (например, Flash Card, RAM (Random Access Memory), имеющие ограниченную область применения из-за относительно небольших объемов памяти по сравнению с вышеназванными носителями информации).

Если требуется быстрый доступ к информации, как, например, при выводе или передаче данных, то используются носители с вращающимся диском. Для архивирования, выполняемого периодически (Backup), наоборот, более предпочтительными являются ленточные носители. Они имеют большие объемы памяти в сочетании с невысокой ценой, правда, при относительно невысоком быстродействии.

По назначению носители информации различаются на три группы:

  • распространение информации: носители с предварительно записанной информацией, такие как CD ROM или DVD-ROM;

  • архивирование: носители для одноразовой записи информации, такие как CD-R или DVD-R (R (record able) – для записи);

  • резервирование (Backup) или передача данных: носители с возможностью многоразовой записи информации, такие как дискеты, жесткий диск, MO, CD-RW (RW (rewritable) – перезаписываемые и ленты.

CD и DVD (ROM, R, RW)

CD-ROM был первоначально создан для того, чтобы распространять большие объемы информации (например, музыку и т.д.) за умеренную плату. Между тем он стал наиболее используемым носителем информации и для меньших объемов данных, например, при личном пользовании. В обозримом будущем CD-ROM могут быть заменены на DVD-ROM. DVD имеет емкость памяти от 4,7 до 17 GB. DVD-ROM может использоваться для распространения программных продуктов, мультимедиа, банков данных и для записи художественных фильмов. Увеличение объема памяти здесь стало возможным благодаря технологии двойного слоя. Она позволяет наносить на верхнюю и нижнюю стороны диска по два накопительных слоя, которые разделяются полуотражающим промежуточным слоем. При считывании информации лазер "прыгает" между обоими накопительными слоями.

Компакт-диск, кратко называемый CD-R (или, соответственно, DVD-R), представляет собой оптическую пластину для одноразовой записи в формате 5,25 дюйма с большой плотностью. Запись на такой диск может быть произведена только один раз в специальном записывающем устройстве. После этого информацию можно считывать посредством обычного дисковода CD-ROM. Типичная область применения – это передача информации в ограниченном количестве.

Более гибким, но менее распространенным является CD-RW (Rewritable). Этот сменный носитель информации может быть перезаписан заново до 1000 раз. Нанесенный слой при записи в результате термооптического процесса изменяет свою структуру с кристаллической на аморфную. В результате на этих местах изменяются отражающие свойства несущего слоя. Интенсивность излучения, соответствующая отражению от светлых или темных участков, преобразуется в бинарные числа 1 или 0.

Сменные накопители

Работа сменного накопителя основывается на использовании магнитных слоев, служащих для многократной записи информации.

Сменные диски SyQuest. Производитель SyQuest, на чав с выпуска дисков емкостью 44 Мб, довел со временем их память до 1,5 Гб. При этом увеличение памяти потребовало применения и нового дисковода. Эти сменные магнитные диски стали часто используемыми носителями данных в допечатных процессах. Картриджи данных. Начиная с 70-х годов эти магнитные накопители относятся к основным средам для резервирования данных. Главным образом они используются для резервного копирования данных на жестком диске персональных компьютеров (PC). Часто при резервировании в сети система автоматически подключает несколько картриджей для обработки накопителей со сменными дисками. Картриджи выпускаются в форматах 5,25 и 3,5 дюйма. Дисководы, предлагаемые различными изготовителями, бывают встроенными или присоединенными к персональному компьютеру. По сравнению с гибкими дисками скорость пересылки данных у картриджей выше, однако она меньше, чем у жестких дисков.

Магнитный ленточный носитель данных (ширина ленты 4 или 8 мм). Среди множества четырех- и восьмимиллиметровых ленточных носителей информации имеются такие, которые в соответствии с новыми разработками отличаются более надежной защитой данных. Это свойство достигнуто благодаря тому, что уменьшено воздействие на подобные ленты статического электричества. Четырехмиллиметровые ленточные носители информации имеют емкость до 4 Гб. У восьмимиллиметровых носителей – 5 Гб. Они используются в банках данных, когда на магнитных лентах должны автоматически сохраняться большие массивы информации.

SuperDisk, ZIP, JAZ. Гибкий диск 3,5 дюйма является наиболее распространенным накопительным носителем в мире. В настоящее время в разработке находятся две системы: технология ZIP фирмы Iomega и SuperDisk (ранее называвшийся LS-120) фирмы Imation.

SuperDisk предоставляет возможность размещения информации объемом 120 Мб и почти не отличается внешне от традиционной 3,5-дюймовой дискеты. Носитель информации недорогой и "совместим в обе стороны", т.е. на новых дисководах можно также считывать и записывать классические дискеты 1,44 Мб.

Дискеты ZIP фирмы Iomega имеют объем от 100 до 250 Мб и по цене сопоставимы с носителем SuperDisk. Дискеты ZIP в настоящее время очень распространены в издательском деле, из чего можно сделать заключение о соответствующей потребности в сменных носителях такого вида. ZIP не "совместим в обе стороны", а дисковод может обрабатывать только носители ZIP. Время доступа к информации у диска ZIP меньше, чем у диска SuperDisk.

Дискеты 3,5 дюйма "JAZ" фирмы Iomega имеют объем хранения информации до 2 Гб. Магнитооптический диск (CD-MO). Магнитооптические носители, кратко называемые MO, получили широкое распространение. В пользу этой технологии однозначно говорит объем памяти: 640 Мб на носителе 3,5 дюйма и 2,6 Гб на носителе 5,25 дюйма. Их развитие идет быстро. Уже сегодня такие изготовители, как Sony и Philips, говорят об объеме 2,6 Гб у носителей 3,5 дюйма и 10,4 Гб у носителей 5,25 дюймо вого формата. Дисководы MO достигают скорости передачи данных 4 Мб/с, а среднее время доступа составляет менее 25 мс. Размещение и запись данных осуществляются посредством лазера.

Жесткие диски. Наконец следует упомянуть жесткие диски, которые входят в стандартную комплектацию практически каждого компьютера. Объем памяти этих носителей информации постоянно увеличивается и в последнее время достиг около 80 Гб для 31/2’’ диска.

Классификация информации

1. Информация подразделяется по форме представления на 2 вида:

- дискретная форма представления информации - это последовательность символов, характеризующая прерывистую, изменяющуюся величину (количество дорожно-транспортных происшествий, количество тяжких преступлений и т.п.);

- аналоговая или непрерывная форма представления информации - это величина, характеризующая процесс, не имеющий перерывов или промежутков (температура тела человека, скорость автомобиля на определенном участке пути и т.п.).

2. По области возникновения выделяют информацию:

- элементарную (механическую), которая отражает процессы, явления неодушевленной природы;

- биологическую, которая отражает процессы животного и растительного мира;

- социальную, которая отражает процессы человеческого общества.

3. По способу передачи и восприятия различают следующие виды информации:

- визуальную, передаваемую видимыми образами и символами;

- аудиальную, передаваемую звуками;

- тактильную, передаваемую ощущениями;

- органолептическую, передаваемую запахами и вкусами;

- машинную, выдаваемую и воспринимаемую средствами вычислительной техники.

4. Информацию, создаваемую и используемую человеком, по общественному назначению можно разбить на три вида:

- личную, предназначенную для конкретного человека;

- массовую, предназначенную для любого желающего ее пользоваться (общественно-политическая, научно-популярная и т.д.) ;

- специальную, предназначенную для использования узким кругом лиц, занимающихся решением сложных специальных задач в области науки, техники, экономики.

5. По способам кодирования выделяют следующие типы информации:

- символьную, основанную на использовании символов - букв, цифр, знаков и т. д. Она является наиболее простой, но практически применяется только для передачи несложных сигналов о различных событиях. Примером может служить зеленый свет уличного светофора, который сообщает о возможности начала движения пешеходам или водителям автотранспорта.

- текстовую, основанную на использовании комбинаций символов. Здесь так же, как и в предыдущей форме, используются символы: буквы, цифры, математические знаки. Однако информация заложена не только в этих символах, но и в их сочетании, порядке следования. Так, слова КОТ и ТОК имеют одинаковые буквы, но содержат различную информацию. Благодаря взаимосвязи символов и отображению речи человека текстовая информация чрезвычайно удобна и широко используется в деятельности человека: книги, брошюры, журналы, различного рода документы, аудиозаписи кодируются в текстовой форме.

- графическую, основанную на использовании произвольного сочетания в пространстве графических примитивов. К этой форме относятся фотографии, схемы, чертежи, рисунки, играющие большое значение в деятельности человек.

Свойства информации можно рассматривать в трех аспектах: техническом - это точность, надежность, скорость передачи сигналов и т.д.; семантическом - это передача смысла текста с помощью кодов и прагматическом - это насколько эффективно информация влияет на поведение объекта.

Система счисления – совокупность правил наименования и записи чисел. Они делятся на позиционные и непозиционные.

Число — это некоторая абстрактная сущность для описания количества (абстрактная мера количества).

Цифры — это знаки, используемые для записи чисел (арабские цифры, римские цифры).

Код числа — запись числа в некоторой системе счисления.

Отдельную позицию в изображении числа принято называть разрядом, а номер позиции — номером разряда.

Разряд числа возрастает справа налево, от младших разрядов к старшим.

Разрядность — число разрядов в записи числа (совпадает с его длиной).

Существует множество различных систем счисления. Их можно разделить на три категории:

  • — позиционные системы счисления

  • — непозиционные системы счисления

  • — смешанные системы счисления

Позиционные системы счисления — это системы счисления, в которых значение цифры зависит от её положения в числе.

Например, запись «102» обозначает сто два, «120» — сто двадцать, при этом для записи числа используются одни и те же цифры, число зависит от их позиции. Любая позиционная система характеризуется её основанием.

Основание системы счисления — это количество различных знаков или символов, используемых для изображения цифр в данной системе. Например, в десятичной системе используются десять символов (цифры от 0 до 9), следовательно основание системы десять.

Основание также определяет деление чисел на порядки. Числа, меньшие основания N, называются числами первого порядка, до второй степени основания (N·N) — числами второго и так далее. Числа, соотносящиеся на основание, считаются различающимися на один порядок.

Позиционные системы счисления позволяют легко производить арифметические расчёты без применения вычислительной техники (сложение-вычитание, умножение-деление в столбик). Двоичная, десятичная, восьмеричная и шестнадцатеричная системы с основаниями два, десять, восемь и шестнадцать соответственно являются позиционными системами счисления.

В позиционной системе счисления цифры упорядочены в соответствии с их значениями: 1 больше 0, 2 больше 1 и так далее.

Продвижением цифры называют её замену на следующую по величине.

Продвинуть цифру 1 значит заменить её на 2, продвинуть цифру 2 значит заменить её на 3. Продвижение старшей цифры в десятичной системе (это цифра 9) означает замену её на 0.

В двоичной системе, использующей только две цифры — 0 и 1, продвижение 0 означает замену его на 1, а продвижение 1 — замену её на 0.

Целые числа в любой системе счисления формируются с помощью правил счета. Для образования целого числа, следующего за любым данным целым числом, нужно продвинуть крайнюю правую цифру числа, при этом если какая-либо цифра после продвижения стала нулем, то нужно также продвинуть цифру, стоящую слева от неё. Если цифры слева нет, вместо нее ставится ноль и продвигается.

Применяя это правило, запишем первые десять целых чисел в различных системах счисления.

В двоичной системе: 0, 1, 10, 11, 100, 101, 110, 111, 1000, 1001.

В шестнадцатеричной системе: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 (первые десять цифр совпадают с десятичными, а вот числа от 10 до 15 в шестнадцатеричной системе изображаются буквами A, B, C, D, E, F).

В восьмеричной системе: 0, 1, 2, 3, 4, 5, 6, 7, 10, 11.

Непозиционные системы счисления — это такие системы, в которых значение цифры не зависит от ее положения в числе (римская система счисления). При этом система может накладывать определенные ограничения на порядок цифр (расположение по возрастанию или убыванию).

Смешанные системы счисления — это такие системы, в которых числа, заданные в системе счисления с основанием Р изображают с помощью цифр другой системы с основанием Q, где Q < P. Такая система называется (Q‐P)‐ичной со старшим основанием P и младшим основанием Q.

Пример смешанной системы счисления — денежные знаки. Чтобы получить определенную сумму, нужно использовать некоторое количество денежных знаков различного достоинства. Таким образом, у этой системы целый ряд оснований, равный достоинствам денежных знаков, также используется основание той системы, с помощью которой производится их счет (десяток, дюжина).

Также примером смешанной системы счисления является представление времени в виде количества часов, минут и секунд.

Изучение различных систем счисления и арифметических операций над ними необходимо для понимания принципов работы ряда логических элементов цифровых микросхем в приложениях электроники и процессов обработки информации в вычислительных машинах.

Перевод целых чисел из одной системы счисления в другую

            Обозначим преобразование числа Z, представленного в р -ричной системе счисления в представление в q -ричной системе как ZpZq . Теоретически возможно произвести его при любых q и р. Однако подобный прямой перевод будет затруднен тем, что придется выполнять операции по правилам арифметики недесятичных систем счисления (полагая в общем случае, что р,q≠10).

            По этой причине более удобными с практической точки зрения оказываются варианты преобразования с промежуточным переводом ZpZpZq с основанием r, для которого арифметические операции выполнить легко.

            Такими удобными основаниями являются r =1 и r =10, т. е. перевод осуществляется через унарную или десятичную систему счисления.

 

            Преобразование Zp Z1Zq

            Идея алгоритма перевода предельно проста: положим начальное значение Zq:=0 из числа Zp вычтем 1 по правилам вычитания системы р, т. е. Zp:=Zp- 1, и добавим ее к Zq по правилам сложения системы q, т. е. Zq:= Zq +1.  Будем повторять эту последовательность действий, пока не достигнем Zq= 0. Правила сложения с 1 (инкремента) и вычитания 1 (декремента) могут быть записаны так, как представлено в табл. 3.1.

 

 

 

            Примечание: π — перенос в случае инкремента или заем в случае декремента.

 

            Промежуточный переход к унарной системе счисления в данном случае осуществляется неявно — используется упоминавшееся выше свойство независимости значения числа от формы его представления. Рассмотренный алгоритм перевода может быть легко реализован программным путем.

 

            Преобразование ZPZwZq

            Очевидно, первая и вторая часть преобразования не связаны друг с другом, что дает основание рассматривать их по отдельности. Алгоритмы перевода Zw→ Zq вытекают из следующих соображений. Многочлен (3.1) для Zq  может быть представлен в виде:

 

 

 

 

            Из соотношений (3.3) и (3.4) непосредственно вытекают два способа перевода целых чисел из десятичной системы счисления в систему с произвольным основанием q.

Способ 1 является следствием соотношений (3.3), предполагающий следующий алгоритм перевода:

            1. Цело численно разделить исходное число (Z>z) на основании новой системы счисления (q) и найти остаток от деления — это будет цифра 0-го разряда числа Zq.

            2. Частное от деления снова цело численно разделить на q с выделением остатка; процедуру продолжать до тех нор, пока частное от деления не окажется меньше q.

            3. Образовавшиеся остатки от деления, поставленные в порядке, обратном порядку их получения, и представляют Zq .

 

 

            Остатки от деления (3, 4) и результат последнего целочисленного деления (4) образуют обратный порядок цифр нового числа. Следовательно, 123)10 —— 4435.

            Необходимо заметить, что полученное число нельзя читать как "четыреста сорок три", поскольку десятки, сотни, тысячи и прочие подобные обозначения чисел относятся только к десятичной системе счисления. Прочитывать число следует простым перечислением его цифр с указанием системы счисления ("число четыре, четыре, три в пятеричной системе счисления").

            Способ 2 вытекает из соотношения (3.4), действия производятся в соответствии со следующим алгоритмом:

            1. Определить и — 1 — максимальный показатель степени в представления числа по форме (3.1) для основания q.

            2. Цело численно разделить исходное число (Z10) на основание новой системы счисления в степени т — 1 (т. е. qm-1) и найти остаток от деления; результат деления определит первую цифру числа 2 .

            3. Остаток от деления цело численно разделить на g m-2, результат деления принять за вторую цифру нового числа; найти остаток; продолжать эту последовательность действий, пока показатель степени q не достигнет значения 0.

            Продемонстрируем действие алгоритма на той же задаче, что была рассмотрена выше.

 

 

 

            Необходимо еще раз подчеркнуть, что приведенными алгоритмами удобно пользоваться при переводе числа из десятичной системы в какую-то иную или наоборот. Они работают и для перевода между любыми иными системами счисления, однако преобразование будет затруднено тем, что все арифметические операции необходимо осуществлять по правилам исходной (в первых алгоритмах) или конечной(в последнем алгоритме) системы счисления.

            По этой причине переход, например, Z3→Z8 проще осуществить через промежуточное преобразование к десятичной системе Z3→ Z10→ Z8. Ситуация, однако, значительно упрощается, если основания исходной и конечной систем счисления оказываются связанными соотношением р = qr, где r — целое число (естественно, большее 1) или r = 1/п (n >1, целое) — эти случаи будут рассмотрены далее.

Арифметические операции в двоичной системе счисления

Ср, 07/21/2010 - 02:13 — pypath

В двоичной системе счисления арифметические операции выполняются по тем же правилам, что и в десятичной системе счисления, т.к. они обе являются позиционными (наряду с восьмеричной, шестнадцатеричной и др.).

Сложение

Сложение одноразрядных двоичных чисел выполняется по следующим правилам:

0 + 0 = 0

1 + 0 = 1

0 + 1 = 1

1 + 1 = 10

В последнем случае, при сложении двух единиц, происходит переполнение младшего разряда, и единица переносится в старший разряд. Переполнение возникает в случае, если сумма равна основанию системы счисления (в данном случае это число 2) или больше его (для двоичной системы счисления это не актуально).

Сложим для примера два любых двоичных числа:

1101

+ 101

------

10010

Вычитание

Вычитание одноразрядных двоичных чисел выполняется по следующим правилам:

0 - 0 = 0

1 - 0 = 1

0 - 1 = (заем из старшего разряда) 1

1 - 1 = 0

Пример:

1110

- 101

----

1001

Умножение

Умножение одноразрядных двоичных чисел выполняется по следующим правилам:

0 * 0 = 0

1 * 0 = 0

0 * 1 = 0

1 * 1 = 1

Пример:

1110

* 10

------

+ 0000

1110

------

11100

Деление

Деление выполняется так же как в десятичной системе счисления:

1110 | 10

|----

10 | 111

----

11

10

----

10

10

----

0

Логическими операциями над двоичными числами являются: Конъюнкция (AND), дизъюнкция (OR), отрицание (NOT), сложение по модулю2 (XOR). Они могут применяться в следующих контекстах:

- логическое “И” – инвертировать в двоичном представлении информации некоторые биты со значения 1 в значение 0. Положим, в битовом представлении символа с именем SIM необходимо 5-ый и 0-ой биты установить в 0. Для этого применим команду

AND SIM, 11011110b;

- логическое “ИЛИ” – установить в 1 заданные биты двоичного представления информации. Например, в битовом представлении символа с именем SIM необходимо 5-ый и 6-ой биты установить в 1, неизменяя значения других битов двоичного представления. Для этого применим команду

OR SIM, 0110000b;

- сложение по модулю 2 – обнулить индексный регистр SI можно командой

XOR SI, SI.

Все виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1). Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком.

Традиционно для кодирования одного символа используется количество информации, равное 1 байту, т. е. / = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):

К = 2I = 28 = 256,

т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер — по их коду.

Присвоение символу определенного числового кода – это вопрос соглашения. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).

Файл:Фионин KodASCII.gif Международная кодировка ASCII

Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений, а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки. К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO), что вызывает дополнительные трудности при работе с русскоязычными документами.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.

Файл:Фионин таблица 4KOI.gif Кодировка КОИ8-Р

Наиболее распространенной в настоящее время является кодировка Microsoft Windows), обозначаемая сокращением CP1251 ("CP" означает "Code Page", "кодовая страница").

Файл:Фионин Kod-win.gif Кодировка CP1251

Таким образом, тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов.

Двоичный код

Десятичный код

КОИ8

СР1251

СР866

Мас

ISO

11000010

194

б

В

-

-

Т

Для представления символов в числовой форме был предложен метод кодирования, получивший в дальнейшем широкое распространение и для других видов представления нечисловых данных (звуков, изображений и др.). Кодом называется уникальное беззнаковое целое двоичное число, поставленное в соответствие некоторому символу. Под алфавитом компьютерной системы понимают совокупность вводимых и отображаемых символов. Алфавит компьютерной системы включает в себя арабские цифры, буквы латинского алфавита, знаки препинания, специальные символы и знаки, буквы национального алфавита, символы псевдографики — растры, прямоугольники, одинарные и двойные рамки, стрелки. Первоначально для хранения кода одного символа отвели 1 байт (8 битов), что позволяло закодировать алфавит из 256 различных символов. Система, в которой каждому символу алфавита поставлен в соответствие уникальный код, называется кодовой таблицей. Разные производители средств вычислительной техники создавали для одного и того же алфавита символов свои кодовые таблицы. Это приводило к тому, что символы, набранные с помощью одной таблицы кодов, отображались неверно при использовании другой таблицы. Для решения проблемы многообразия кодовых таблиц в 1981 г. Институт стандартизации США принял стандарт кодовой таблицы, получившей название ASCII (American Standard Code of Information Interchange — американский стандартный код информационного об- мена). Эту таблицу использовали программные продукты, работающие под управлением операционной системы MS-DOS, разработанной компанией Microsoft по заказу крупной фирмы — производителя персональных компьютеров IBM (International Business Machine). Широкое распространение персональных компьютеров фирмы IBM привело к тому, что стандарт ASCII приобрел статус международного.

Для кодирования текстовой информации принят международный стандарт ASCII  (American Standard Code for Information Interchange).

Кодовая таблица - это внутреннее представление символов в компьютере. 

ASCII — American Standard Code for Information Interchange — американский стандартный код для обмена информацией.

В таблице отображены 256 символов, каждому из которых поставлен в соотвествие номер - код. Код представлен в компьютере в двоичном виде. Длина кода равна 1 байт (8 бит). 

 ASCII-код  представляет собой 8-битную кодировку для представления:

* десятичных цифр,

* латинского и национального алфавитов,

* знаков препинания и управляющих символов.

Кодировки ANSI и Unicode

Категория: 'XP

Первой известной кодировкой символов была кодировка ASCII, и она используется до сих пор. В ASCII-кодировке каждый символ занимает 8 бит, или один байт. Из-за того, что ASCII была предназначена для западных языков, ее использование было ограничено в европейских странах и регионах, чьи языки содержали символы, не включенные в 256 символов, поддерживаемых ASCII. Чтобы обойти это ограничение, Международная организация по стандартизации (ISO - International Standards Organization) создала новый стандарт кодировки символов, названный Latin-1, который содержал европейские символы, не вошедшие в набор ASCII. Microsoft расширила Latin-1 и назвала этот стандарт ANSI. Но ANSI по-прежнему осталась 8-битной кодировкой, которая может представлять только 256 уникальных символов. Многие языки имеют тысячи символов, особенно азиатские языки, такие как китайский, корейский и японский. Для преодоления ограничений стандарта на 8-битную кодировку символов, Microsoft в сотрудничестве с такими компаниями, как Apple Computer, Inc., и IBM, создала некоммерческий консорциум Unicode, Inc., целью которого стало определение нового стандарта на кодировку символов для международных наборов символов. Работа, проделанная в Unicode, была объединена с работой, которая велась в ISO, и результатом стал стандарт Unicode для кодировки символов. Unicode является 16-разрядным стандартом, что обеспечивает 65 536 уникальных символов - более чем достаточно для представления всех языков мира. Он поддерживает даже архаические языки, такие как санскрит и египетские иероглифы, и включает знаки препинания, математические и графические символы.

Родной кодировкой для Windows XP является Unicode, но она поддерживает и ANSI. Внутри себя операционная система представляет имена объектов, пути и имена файлов в виде 16-битовых символов Unicode. Она также обычно использует Unicode для хранения данных в реестре. Если программа сохраняет текст Jerry с использованием ANSI, то он будет выглядеть в памяти как 0х4А 0×65 0×72 0×72 0×79. Однако если программа сохраняет этот же текст с использованием Unicode, то он будет выглядеть в памяти как 0х4А 0×00 0×65 0×00 0×72 0×00 0×72 0×00 0×79 0×00. Почему? Потому, что текст Unicode является 16-битным, и Windows XP сохраняет 16-битные числа в прямом порядке (см. «Прямой и обратный порядок байтов» ранее в этой главе). Таким образом, она запишет в память J как 0х004А (байты перевернуты), затем е как 0×0065, а затем оставшиеся символы как 0×0072, 0×0072, как 0×0079. Значение null и пустые строки Если вы писали программы, используя такой язык, как С, то вы должны быть знакомы с концепцией значения null, null является нулевым символом, или 0×00. Windows XP помещает символ null в конце строк так, что программы знают, где заканчивается строка. В реестре имеется похожая концепция, когда значение может иметь в качестве данных null, что означает, что данных нет вообще. Оно пустое. Обычно, когда вы смотрите на значение null в реестре, вы видите текст «(value not set)» («(значение не присвоено)»). Оно отличается от значения, которое содержит пустую строку - текст, чья длина равна 0, или “”. Значения null и “” не одинаковы

В таблице ACSII отсутствовали символы кириллицы. Для ее представления была разработана кодовая страница СР866, построенная на основе ACSII. Символы с кодами от 0 до 127 в этой таблице такие же, а символы кириллицы расположены на тех позициях, где в таблице ACSII находятся относительно редко используемые символы национальных алфавитов и греческие буквы. Символам кириллицы соответствуют десятичные коды от 128 до 175 и от 224 до 239.

С появлением графической среды Windows ASCII морально устарела, в частности стали не нужными псевдографические символы. Фирмой Microsoft была использована новая кодовая таблица – ANSI. Для представления кириллицы в Windows на основе кодировки ANSI построена кодовая страница CP1251. Символам кириллицы здесь соответствуют шестнадцатеричные коды от С0 до FF или в десятичной системе от 192 до 255.

КОИ-8 (код обмена информацией, 8 битов), KOI8 — восьмибитовая ASCII-совместимая кодовая страница, разработанная для кодирования букв кириллических алфавитов.

Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7. КОИ-7 и КОИ-8 описаны в ГОСТ 19768-74 (сейчас недействителен, на сайте Федерального агентства по метрологии о нём даже не осталось упоминания), более новая версия ГОСТ 19768-93 нормирует совсем другие значения кодов).

Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убирать восьмой бит каждого символа, то получается «читаемый» текст, хотя он и написан латинскими символами. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.

Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющие определённые коды (общий диапазон 192-255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U.

KOI8-R стал фактически стандартом для русской кириллицы в 1990-х годах в юникс-подобных операционных системах и электронной почте.

IETF утвердил несколько RFC по вариантам кодировки KOI-8:

  • RFC1489 - KOI8-R

  • RFC2319 - KOI8-U

  • RFC1345 - ISO-IR-111 (с ошибкой в определении основного диапазона)

IANA зарегистрировала их в своём списке.

Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.

В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.

UTF-8 — представление Юникода, обеспечивающее наилучшую совместимость со старыми системами, использовавшими 8-битные символы. Текст, состоящий только из символов с номером меньше 128, при записи в UTF-8 превращается в обычный текст ASCII. И наоборот, в тексте UTF-8 любой байт со значением меньше 128 изображает символ ASCII с тем же кодом. Остальные символы Юникода изображаются последовательностями длиной от 2 до 6 байт (на деле, только до 4 байт, поскольку в Юникоде нет символов с кодом больше 10FFFF, и вводить их в будущем не планируется), в которых первый байт всегда имеет вид 11xxxxxx, а остальные — 10xxxxxx.

Формат UTF-8 был изобретён 2 сентября 1992 года Кеном Томпсоном и Робом Пайком и реализован в Plan 9[13]. Сейчас стандарт UTF-8 официально закреплён в документах RFC 3629 и ISO/IEC 10646 Annex D.

UTF-16 - один из способов кодирования символов из Unicode в виде 16-битных последовательностей. Символы с кодами меньше 0x10000 (216) представляются как есть (одна 16-битная последовательность), а символы с кодами 0x10000-0x10FFFE - в виде двух 16-битовых последовательностей (так называемая «суррогатная» пара), первая из которых лежит в диапазоне 0xD800 -0xDBFF, а вторая - 0xDC00-0xDFFF. Легко видеть, что существует 2 10 * 2 10 = 2 20 таких комбинаций. А общее количество возможных символов 2 20 + 2 16 = 1114112. Следует отметить, что по стандарту никакие символы не могут иметь кодов собственно из диапазона 0xD800-0xDFFF, так что расшифровка кодировки всегда однозначна. Впрочем, в подавляющем большинстве случаев текст в UTF-16 является просто последовательностью символов из UCS-2, поскольку символы Unicode после кода 0x10000 используются крайне редко.

UTF-16LE и UTF-16BE В потоке данных UTF-16 старший байт может записываться либо перед младшим (UTF-16 Big Endian или UTF-16BE), или после младшего (UTF-16 Little Endian или UTF-16LE). Иногда кодировку Юникода Big Endian (UTF-16BE) называют Юникод с обратным порядком байтов. Аналогично существует два варианта 32-битного кодирования: UTF-32LE и UTF-32BE.

Основные методы защиты информации:

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]