Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информ / кодирование текстовой информации.doc
Скачиваний:
169
Добавлен:
30.03.2015
Размер:
135.68 Кб
Скачать

Решение задач на тему «Кодирование текстовой информации»

Типы задач:

  1. Объем памяти, занимаемый текстом.

  2. Кодирование (декодирование) текстовой информации.

  3. Внутреннее представление текста в компьютере.

  1. Объем памяти, занимаемый текстом.

Методические рекомендации:

В задачах такого типа используются понятия:

  • алфавит,

  • мощность алфавита

  • символ,

  • единицы измерения информации (бит, байт и др.)

Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (28 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.

Уровень «3»

1. Сколько бит памяти займет слово «Микропроцессор»?([1], c.131, пример 1)

Решение:

Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.

Ответ: 112 бит

2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c.133, №31)

Решение:

Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.

Ответ: 256 символов

3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c.133, №32)

Решение:

30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.

Ответ: 10500 байт

4. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:

Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)

1)

400 бит

2)

50 бит

3)

400 байт

4)

5 байт

Решение:

В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.

Ответ: 400 бит

5. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)

Решение:

В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.

Ответ: 320 бит

6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode:

Каждый символ кодируется 8 битами.

(ЕГЭ_2005, уровень А)

Решение:

34 символа в предложении. Переведем в биты: 34*16=544 бита.

Ответ: 544 бит

7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:

В одном килограмме 100 грамм.

(ЕГЭ_2005, уровень А)

Решение:

19 символов в предложении. 19*2 =38 байт

Ответ: 38 байт

Уровень «4»

8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c.133, №34)

Решение:

  1. 40*9 = 360 -секторов на дискете.

  2. 180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе.

  3. 5*1024= 5120 символов содержит текст.

Ответ: 5120 символов

9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.

Решение:

Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит.

Переведем результат в байты. 14000 : 8 =1750 байт

Ответ: 1750 байт.

Уровень «5»

10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)

Решение:

  1. Найдем объем сообщения. 30*60*8*100 =1440000 бит.

  2. Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секунд

Ответ: 50 секунд

11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В)

Решение:

  1. Переведем 225 Кб в биты.225 Кб *1024*8 =1843200 бит.

  2. Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд.

Ответ: 128 секунд

  1. Кодирование (декодирование) текстовой информации.

Методические рекомендации:

В задачах такого типа используются понятия:

Кодирование –отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.

Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.

Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.

Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):

  • КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование)

1) #154 неразрывный пробел.

Рис.1 Кодировка КОИ8-Р

  • ASCII –AmericanStandardCodeforInformationInterchange(американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).

1) #32 - пробел.

Рис. 2 Международная кодировка ASCII

  • Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские).Cего помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов

  • СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").

1) #160 неразрывный пробел,

2)  #173 мягкий перенос.

Рис. 3 Кодировка CP1251

  • СР866 - кодировка под MS DOS

1) #255 неразрывный пробел.

Рис. 4 Кодировка СР866

  • Мас –кодировка в ПК фирмы Apple, работающих под управлением операционной системыMac OS.

    1. #202 неразрывный пробел.

Рис. 5 Кодировка Mac

  • ISO 8859-5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.

 1) Коды 128-159 не используются;

2)  #160 неразрывный пробел,

3)  #173 мягкий перенос.

Рис. 6 Кодировка ISO 8859-5