
- •Решение задач на тему «Кодирование текстовой информации»
- •Уровень «3»
- •14. Декодируйте следующие тексты, заданные десятичным кодом: а) 087 111 114 100; б) 068 079 083; в) 080 097 105 110 116 098 114 117 115 104.
- •20. Десятичный код (номер) буквы «I» в таблице кодировки символов ascii равен 105. Какая последовательность десятичных кодов будет соответствовать слову information? ([1], №37, стр.134) Решение:
- •Уровень «5»
- •Литература:
Решение задач на тему «Кодирование текстовой информации»
Типы задач:
Объем памяти, занимаемый текстом.
Кодирование (декодирование) текстовой информации.
Внутреннее представление текста в компьютере.
Объем памяти, занимаемый текстом.
Методические рекомендации:
В задачах такого типа используются понятия:
алфавит,
мощность алфавита
символ,
единицы измерения информации (бит, байт и др.)
Для представления текстовой (символьной) информации в компьютере используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации (28 =256). 8 бит =1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
Уровень «3»
1. Сколько бит памяти займет слово «Микропроцессор»?([1], c.131, пример 1)
Решение:
Слово состоит из 14 букв. Каждая буква – символ компьютерного алфавита, занимает 1 байт памяти. Слово занимает 14 байт =14*8=112 бит памяти.
Ответ: 112 бит
2. Текст занимает 0, 25 Кбайт памяти компьютера. Сколько символов содержит этот текст? ([1], c.133, №31)
Решение:
Переведем Кб в байты: 0, 25 Кб * 1024 =256 байт. Так как текст занимает объем 256 байт, а каждый символ – 1 байт, то в тексте 256 символов.
Ответ: 256 символов
3. Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объем оперативной памяти (в байтах) займет этот текст? ([1], c.133, №32)
Решение:
30*70*5 = 10500 символов в тексте на 5 страницах. Текст займет 10500 байт оперативной памяти.
Ответ: 10500 байт
4. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа! (ЕГЭ_2005. демо, уровень А)
1) |
400 бит |
2) |
50 бит |
3) |
400 байт |
4) |
5 байт |
Решение:
В тексте 50 символов, включая пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, Следовательно, переведем в биты 50*8= 400 бит.
Ответ: 400 бит
5. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения в кодировке КОИ-8: Сегодня метеорологи предсказывали дождь. (ЕГЭ_2005, уровень А)
Решение:
В таблице КОИ-8 каждый символ закодирован с помощью 8 бит. См. решение задачи №4.
Ответ: 320 бит
6. Считая, что каждый символ кодируется 16 битами, оцените информационный объем следующего предложения в кодировке Unicode:
Каждый символ кодируется 8 битами.
(ЕГЭ_2005, уровень А)
Решение:
34 символа в предложении. Переведем в биты: 34*16=544 бита.
Ответ: 544 бит
7. Каждый символ закодирован двухбайтным словом. Оцените информационный объем следующего предложения в этой кодировке:
В одном килограмме 100 грамм.
(ЕГЭ_2005, уровень А)
Решение:
19 символов в предложении. 19*2 =38 байт
Ответ: 38 байт
Уровень «4»
8. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст? ([1], c.133, №34)
Решение:
40*9 = 360 -секторов на дискете.
180 Кбайт : 360 * 10 =5 Кбайт – поместится на одном секторе.
5*1024= 5120 символов содержит текст.
Ответ: 5120 символов
9. Сообщение передано в семибитном коде. Каков его информационный объем в байтах, если известно, что передано 2000 символов.
Решение:
Если код символа содержит 7 бит, а всего 2000 символов, узнаем сколько бит займет все сообщение. 2000 х 7=14000 бит.
Переведем результат в байты. 14000 : 8 =1750 байт
Ответ: 1750 байт.
Уровень «5»
10. Сколько секунд потребуется модему, передающему сообщение со скоростью 28800 бит/с, чтобы передать 100 страниц текста в 30 строк по 60 символов каждая, при условии, что каждый символ кодируется одним байтом? (ЕГЭ_2005, уровень В)
Решение:
Найдем объем сообщения. 30*60*8*100 =1440000 бит.
Найдем время передачи сообщения модемом. 1440000 : 28800 =50 секунд
Ответ: 50 секунд
11. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/с, чтобы передать сообщение длиной 225 Кбайт? (ЕГЭ_2005, уровень В)
Решение:
Переведем 225 Кб в биты.225 Кб *1024*8 =1843200 бит.
Найдем время передачи сообщения модемом. 1843200: 14400 =128 секунд.
Ответ: 128 секунд
Кодирование (декодирование) текстовой информации.
Методические рекомендации:
В задачах такого типа используются понятия:
Кодирование –отображение дискретного (прерывного, импульсного) сообщения в виде определенных сочетаний символов.
Код (от французского слова code – кодекс, свод законов) – правило по которому выполняется кодирование.
Кодовая таблица (или кодовая страница) – таблица, устанавливающая соответствие между символами алфавита и двоичными числами.
Примеры кодовых таблиц (имеются на CD диске к учебнику Н. Угринович):
КОИ-7, КОИ-8 – кодирование русских букв и символов (семи-, восьми -битное кодирование)
1) #154 неразрывный пробел.
Рис.1 Кодировка КОИ8-Р
ASCII –AmericanStandardCodeforInformationInterchange(американский стандарт кодов для обмена информацией) – это восьмиразрядная кодовая таблица, в ней закодировано 256 символов (127- стандартные коды символов английского языка, спецсимволы, цифры, а коды от 128 до 255 – национальный стандарт, алфавит языка, символы псевдографики, научные символы, коды от 0 до 32 отведены не символам, а функциональным клавишам).
1) #32 - пробел.
Рис. 2 Международная кодировка ASCII
Unicode – стандарт, согласно которому для представления каждого символа используется 2 байта. (можно кодировать математические символы, русские, английские, греческие, и даже китайские).Cего помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов
СР1251 - наиболее распространенной в настоящее время является кодировка Microsoft Windows, ("CP" означает "Code Page", "кодовая страница").
1) #160 неразрывный пробел,
2) #173 мягкий перенос.
Рис. 3 Кодировка CP1251
СР866 - кодировка под MS DOS
1) #255 неразрывный пробел.
Рис. 4 Кодировка СР866
Мас –кодировка в ПК фирмы Apple, работающих под управлением операционной системыMac OS.
#202 неразрывный пробел.
Рис. 5 Кодировка Mac
ISO 8859-5 -Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку.
1) Коды 128-159 не используются;
2) #160 неразрывный пробел,
3) #173 мягкий перенос.
Рис. 6 Кодировка ISO 8859-5