Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теоретическая Информатика

.pdf
Скачиваний:
65
Добавлен:
11.04.2015
Размер:
6.24 Mб
Скачать

§ 2. Основы редактирования текста

345

 

 

Иногда встречаются ошибки в программах, приво- дящие к нарушению технологии набора, например, курсор мигает, но набор невозможен, либо набор про- исходит без курсора.

Курсор может иметь различный вид.

1)При графическом интерфейсе курсор имеет вид мигаю- щей вертикальной палочки |.

2)В текстовом интерфейсе курсор обычно имеет вид сим- вола подчеркивания _ или ячейки текстовой матрицы █ .

Это стандартный вид курсора. В компьютерных играх и других программах курсор может принимать самый затейли- вый вид.

Не перепутайте курсор с указателем мыши! Указатель мы- ши, связанный с набором текста имеет следующий стандарт- ный вид.

1)При графическом интерфейсе указатель мыши в том месте экрана, где можно набирать текст и где можно поставить курсор, имеет вид прописной латинской буквы I (или римской единицы): .

2)На экране с текстовым интерфейсом указатель мыши обычно имеет вид ячейки текстовой матрицы █ , который мо- жет совпадать с видом текстового курсора.

3. Рассмотрим понятие «на курсоре».

Символ на курсоре текстовый символ, находящийся в сле- дующем месте:

1)при текстовом интерфейсе над или на курсоре в виде символа подчеркивания _, на или под курсором в виде прямо- угольника █ ;

2)при графическом интерфейсе справа от курсора в виде вертикальной палочки |.

Символ на курсоре также можно называть текущим симво-

лом, или символом в фокусе.

Выражение «текст набирается на курсоре» означает, что набираемый текстовый символ появляется на курсоре при текстовом интерфейсе и после курсора при графическом ин- терфейсе.

346

Глава 3. Текстовый редактор

2°. С о х р а н е н и е и

п р о с м о т р т е к с т а

I. Сохранение является одной из важнейших функций лю- бых редакторов, в том числе и текстовых. Если пользователь вовремя не сохранит свои данные, то они могут потеряться.

Сохранение (save, читается «сэйв») — запись данных на но- ситель постоянной памяти в виде файла во время работы в программе.

Формат файла вид кодирования данных, сохраненных в файле. Обычно формат файла связан с расширением файла.

Формат файла также называется его типом. Закодированные текстовые данные, сохраненные тексто-

вым редактором, могут оказаться в одном из трех классов форматов.

1. Формат аски-кодов сохраненный неформатированный текст. Это не означает, что в файле содержатся только симво- лы аски-кодов.

Формат аски-кодов содержит символы текста только в коди- ровке какой-нибудь кодовой таблицы.

Формат аски-кодов также называют форматом «только текст». Только когда текст набран на английском языке, формат аски-кодов содержит закодированные символы аски-кодов и,

возможно, коды конца строки и табуляции.

Если текст набирался на русском языке, то формат аски-ко- дов содержит символы в кодировке какой-нибудь русской ко- довой таблицы и, возможно, коды конца строки и табуляции.

Файлы в формате аски-кодов обычно имеют расширение

.txt.

2. Текст с разметкой является сохраненным текстом, форма- тированным с помощью языка разметки.

Текст с разметкой содержит символы текста и символы язы- ка разметки в кодировке какой-нибудь кодовой таблицы.

Текст с разметкой это формат аски-кодов, в котором, кроме смыслового текста, содержится также служебный, т. е. текст с информацией о формате текста. Внешний вид текста с разметкой получается при его просмотре или печати тексто- вым процессором, понимающим язык разметки.

§ 2. Основы редактирования текста

347

 

 

Файлы в формате текста с разметкой имеют расширение, отвечающее языку разметки и текстовому процессору, рабо- тающему с этим языком.

HTML язык разметки веб-страниц, а также формат фай- лов. HTML-файл имеет расширение .htm или аналогичное.

ТеХ язык разметки текстового процессора ТеХ, а также формат файлов. ТеХ-файл имеет расширение .tex.

3. Текст в формате текстового процессора это сохранен-

ный текст, форматированный без помощи языка разметки. Как текст, так и его параметры форматирования кодируются специальным способом используемого текстового процессора.

Текст в формате текстового процессора может содержать символы текста и параметры его форматирования в кодиров- ке, отличной от кодировки кодовых таблиц.

doc кодировка текста и параметров его форматирования текстового процессора Word, а также формат файлов. Файлы в формате текстового процессора Word имеют расширение .doc.

II. Чтобы текст имел нужный внешний вид, его формати- руют: разбивают на абзацы, выделяют заголовки, вставляют таблицы, рисунки и формулы и т. д. Внешний вид текста ви- ден при его просмотре.

Имеются три основных способа просмотра текстов.

1. Форматированный просмотр.

Форматированный текст нужно просматривать в том тек- стовом процессоре, в котором он был создан. Обычно такой же вид текст будет иметь и на печати.

Текст, форматированный в одном текстовом процес- соре, могут интерпретировать другие редакторы. Одна- ко такой просмотр не рекомендуется, т. к. в этом случае невозможно передать все нюансы сложного форматиро- вания.

Форматированный просмотр просмотр текста в том виде, к

которому пользователь стремился при его форматировании. В редакторе WYSIAWIG форматированный просмотр про-

исходит сразу при наборе текста.

348

Глава 3. Текстовый редактор

В редакторах с разметкой без WYSIAWIG при наборе текст всегда виден в формате аски-кодов, а чтобы просмотреть текст в форматированном виде, нужно воспользоваться специаль- ной программой. Например, если создавать HTML-текст в простом редакторе, то его просмотреть можно в браузере IE.

Редактор FrontPage показывает форматированный текст при его наборе. Это пример WYSIAWIG-редактора для работы с текстом с языком разметки.

Неформатированный текст можно просмотреть в любом текстовом редакторе. При просмотре в текстовом процессоре такой текст принимает форматированный вид, будет напеча- тан форматированный и может быть сохранен уже как фор- матированный текст.

2. Символьный просмотр.

Вид неформатированного текста при его просмотре в про- стом текстовом редакторе редко совпадает с видом текста при печати. Это связано с тем, что неформатированный текст на экране и при печати по-разному разбивается на строки.

Форматированный файл, как и любой другой, состоит из байтов и может быть просмотрен как неформатированный, ко- гда каждый байт передаются символами кодовой таблицы. При форматировании текста языком разметки текст имеет именно такой вид.

Символьный просмотр побайтный просмотр любого тек- стового файла как неформатированного, в виде символов ко- довой таблицы.

3. Шестнадцатеричный просмотр.

Параметры форматирования текста могут включать коды из диапазона 0—31, которые не все представлены символами и при символьном просмотре имеют вид пробелов. Чтобы уви- деть такие байты, нужен не символьный просмотр, а просмотр в кодах (который есть, например, в программе Far).

Шестнадцатеричный просмотр просмотр байтов любого файла в шестнадцатеричном виде (1 байт = 2 цифры).

Шестнадцатеричный просмотр также называют hex-

просмотром, или кодовым просмотром.

§ 2. Основы редактирования текста

349

 

 

3°. У п р а ж н е н и я

1. Word при кодировании текстов использует уникодов- скую двухбайтную спецификацию. Для кодирования аски- -кодов и, в частности, букв латинского алфавита используется октет 00, а для русских букв октет 04.

Поэтому текст «abcde абвгд» при символьном просмотре (например, в оболочке Far) будет выглядеть так:

ab c d e 01234

апри шестнадцатеричном «честном» просмотре так:

61 00 62 00 63 00 64 00 65 00 20 00 30 04 31 04 32 04 33 04 34 04

Это означает, что латинская строчная буква «a» находится в октете 00, как аски-код, в котором имеет шестнадцатеричный код 61. Причем Word при кодировании символов переставляет местами байты их кодировки: латинская «a» имеет шестнадца- теричный код 0061, а Word пишет в файле 6100.

«b» кодируется Word как 6200, «c» — 6300, «d» — 6400 и «e» — 6500. Код 00 при символьном просмотре передается пробелом.

Затем идет переставленный уникод пробела 2000, за ним шестнадцатеричные уникоды русских букв «а», «б», «в», «г» и «д» из октета 04: 3004, 3104, 3204, 3304 и 3404. Код 20 при сим-

вольном просмотре передается также пробелом.

При символьном просмотре каждый байт (двузначное ше- стнадцатеричное число) передается соответствующим симво- лом из аски-кодов. Так, русскую строчную букву «а» Word за- пишет кодом 3004, поэтому 30 передается цифрой 1, шестна- дцатеричный код которой 30, а 04 — ромбиком, или бубной.

Выпишите, как при символьном и шестнадцатеричном просмотре будут переданы записанные в Word:

а) все 26 строчных латинских букв, разделенных пробелами (см., например, прил. 2.8):

a b c d e f g h i j k l m n o p q r s t u v w x y z

б) все 33 строчные русские буквы, разделенные пробелами (см., например, прил. 2.9):

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я

350

Глава 3. Текстовый редактор

2. Основные технологии редактирования текста

1°. Р е д а к т и р о в а н и е

о д н о г о с и м в о л а

1.Редактирование текста отличается от его форматирова- ния. При форматировании изменяются параметры внешнего вида текста, а при редактировании добавляются, удаляются и изменяются символы, составляющие текст.

Редактирование текста это следующие три действия, ко- торые можно производить над символами текста:

1) добавление символов;

2) удаление символов;

3) дублирование символов.

Редактирование текста также называют набором текста. Две первые операции можно проводить двумя принципи-

ально разными способами:

1) операции добавления и удаления производятся с одним символом;

2) операции добавления и удаления производятся сразу с несколькими символами.

Третья операция проводится только с несколькими симво- лами.

Текстовый редактор может находиться в двух режимах: 1) редактирование одного символа на курсоре;

2) редактирование блоков символов при отсутствии курсора.

2.Рассмотрим режим редактирования одного символа. Случай выделения одного символа и редактирования его как блока в этом пункте не рассматривается.

Режим редактирования одного символа состояние редактора при отсутствии блока символов и наличия курсора.

В этом режиме в редакторе можно только добавлять и уда- лять по одному символу.

Добавление одного символа, или набор символов набор сим-

волов на курсоре на клавиатуре или с помощью мыши. Существует два универсальных алгоритма набора текста,

действующих в любых текстовых редакторах, и еще один в текстовом процессоре Word.

§ 2. Основы редактирования текста

351

 

 

А л г о р и т м ы 3 . 3 . Н а б о р т е к с т а .

 

1.Набор символа. Набор символа на курсоре на алфавитно- цифровой клавиатуре.

2.Набор кода символа. Набор кода символа на курсоре на вспомогательной клавиатуре.

3.Вставка символа. Выбор мышью или клавиатурой символа

вокне Символ опции Символ… меню Вставка текстового процессора Word. Символ появляется в тексте на курсоре.

Если при наборе текста курсор находится в самом конце текста, то набор текста всегда является его вставкой, если же курсор в середине текста, то набор зависит от режима тек-

стового редактора: режима вставки или режима замещения.

Режим вставки состояние текстового редактора, при ко- тором набираемый символ раздвигает текст, т. е. вставляется перед символом на курсоре.

Режим замещения состояние текстового редактора, при котором набираемый символ замещает символ на курсоре.

Замещение одного символа добавление одного символа в режиме замещения, при этом символ на курсоре удаляется.

Режим замещения также называют режимом забоя.

Режим вставки более удобен и надежен, т. к. удаляе- мый текст всегда можно удалить как блок. Поэтому ре- комендуется пользоваться только режимом вставки, и следует воспользоваться его фиксацией (как в Word).

Признак режима либо появление соответствующей над- писи на экране, либо изменение вида курсора. При отсутствии такой индикации режим определяется «методом тыка».

3. Существует два способа удаления одного символа. Удаление одного символа непосредственное удаление сим-

вола с помощью клавиши удаления на клавиатуре.

А л г о р и т м ы 3 . 4 . У д а л е н и е с и м в о л а .

1.Удаление символа на курсоре. Удаление символа, находяще-

гося на курсоре, нажатием любой клавиши DELETE.

2.Удаление символа перед курсором. Удаление символа, стоя-

щего перед символом на курсоре, нажатием клавиши Забой.

352 Глава 3. Текстовый редактор

2°. Реда ктирова ние блока символов 1. Блок символов фиксированная пользователем часть текста.

Выделение символов фиксация блока символов. Обычно блок выделяются на фоне текста другим цветом, курсора нет.

Выделение вперед выделение блока с первого символа бло- ка по направлению к концу текста.

Выделение назад выделение блока с последнего символа блока по направлению к началу текста.

Признак режима блока символов наличие блока. Блок символов обладает следующими свойствами:

1)можно выделить только один блок символов;

2)начать выделение можно с любого символа текста;

3)обычно символы выделяются последовательно друг за другом;

4)выделение производится либо вперед, либо назад;

5)количество символов в блоке может быть любым от одного до всех символов текста;

6)чтобы в блок вошли все символы текста, их выделяют ли- бо с первого до последнего, либо с последнего до первого.

2. Любая операция с блоком символов происходит при не- пременном участии буфера обмена.

Буфер обмена область компьютерной памяти с данными, обладающая следующими свойствами:

1)в буфер обмена может попасть только один блок специ- альным образом выделенных данных;

2)с буфером обмена могут последовательно работать лю- бые компьютерные программы;

3)буфер обмена сохраняет свое содержимое до тех пор, по- ка данные не будут заменены новыми;

4)при выключении компьютера или перезагрузке опера- ционной системы содержимое буфера обмена пропадают.

В более развитых операционных системах буфер об- мена может состоять из нескольких гнезд.

Режим редактирования блока символов состояние редактора при наличии выделенного блока символов и отсутствия кур- сора.

§ 2. Основы редактирования текста

353

 

 

Обычно буфер обмена нигде на экране компьютера не присутствует, поэтому пользователю желательно помнить, что он поместил в буфер обмена последний раз.

3.С выделенными данными и с данными, размещенными в буфере обмена, можно производить, прежде всего, следующие две операции. В текстовых редакторах выделенными данными является блок символов или другие данные.

Копирование блока символов очистка буфера обмена и по-

следующее занесение в него выделенного блока символов. Удаление блока символов удаление выделенного блока

символов без занесения его в буфер обмена; буфер обмена не меняется.

Перемещение блока символов операция, состоящая их двух операций: копирование блока символов с последующим его удалением.

Перемещение блока символов также называют вырезанием. Эти операции производятся независимо от режимов тек-

стового редактора.

4.Операция добавления блока символов происходит по- разному в зависимости от режимов редактора и самого редак- тора. При работе в конкретном редакторе рекомендуется сна- чала исследовать добавление блока символов в режиме редак- тирования блока символов.

Вставка блока символов вставка в текст блока символов из буфера обмена, если в буфере обмена есть блок символов, причем:

1) в режиме редактирования одиночного символа блок символов всегда вставляется перед символом на курсоре;

2) в режиме редактирования блока символов возможны следующие два случая в зависимости от редактора:

2а) независимо от режима вставки или замещения блок символов из буфера обмена всегда замещает выделенный блок символов;

2б) в режиме вставки блок символов из буфера обмена вставляется после выделенного блока символов, в режиме за-

боя замещает его.

354

Глава 3. Текстовый редактор

3°. У п р а ж н е н и я 1. Определите минимальное количество символов, которые

нужно удалить и вставить, чтобы исправить ошибки в словах. Укажите их.

а. Часто встречающаяся ошибка перестановка букв в слове.

ИНТРЕНЕТ

б. Знаменитый пример четыре ошибки в слове из трех букв.

ИСЧО

2. Определите минимальное количество блоков символов, которые нужно удалить и вставить в тексте этой задачи, чтобы получить в точности текст предыдущей задачи. Укажите эти блоки.

1. Определите минимальное количество символов, которые нужно удалить и вставить, чтобы исправить ошибки в словах. Укажите их.

ИНТРЕНЕТ

б. Знаменитый пример четыре ошибки в слове из трех букв.

ИСЧО

ИНТРЕНЕТ

б. Знаменитый пример четыре ошибки в слове из трех букв.

ИСЧО

ИНТРЕНЕТ

б. Знаменитый пример четыре ошибки в слове из трех букв.

ИСЧО

Имейте в виду, что тривиальный ответ 1 и 1 следует исклю- чить.