Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ППТС-2 / Лабы / Lab4-01.doc
Скачиваний:
26
Добавлен:
12.05.2015
Размер:
1.28 Mб
Скачать

3.6.8.2. Ссылки на символы

Ссылки на символы формируются одним из следующих способов:

  • &#xHH;– гдеHHпредставляет собой шестнадцатеричный код символа в кодировке, указанной в атрибутеencodingобъявления документаXML(в представлении кода можно использовать буквыa-fкак в нижнем, так и в верхнем регистре);

&#DD;– гдеDDпредставляет собой десятичный код символа в кодировке, указанной в атрибутеencodingобъявления документаXML.

3.6.8.3. Операторы повторения

Операторы повторения, используемые в схемах XML, приведены в табл. 4.2.19.

Таблица 4.2.19. Операторы повторения, используемые в схемах XML

Оператор

Действие

?

0 или 1 раз.

*

0 и более раз.

+

1 и более раз.

{m,n}

От m до n раз.

{,n}

По крайней мере, n раз.

{m}

Ровно m раз.

3.6.8.4. Операторы диапазона символов

Для определения собственных подмножеств символов используются выражения, заключенные в квадратные скобки (символы "[" и "]"). Квадратные скобки внутри регулярного выражения считаются одним символом, который может принимать значения, перечисленные внутри этих скобок. Внутри квадратных скобок могут использоваться только следующие метасимволы:

  • "-" – используется для задания набора символов из одного промежутка (например, все цифры могут быть заданы как[0-9]);

  • "^" – если этот символ стоит первым в квадратных скобках, он рассматривается как символ отрицания (например,[^0-9]задает все нецифровые символы);

"\" – делает следующие за ним метасимволы "-", "^" и "]" обычными символами (например, все виды скобок могут быть заданы как[(){}<>[\]]).

3.6.8.5. Специальные символы

Специальные символы, используемые в регулярных выражениях схем XML, приведены в табл. 4.2.20.

Таблица 4.2.20. Специальные символы, используемые в регулярных выражениях схем XML

Символ

Действие

\n

Переход на новую строку.

\r

Возврат каретки.

\t

Горизонтальная табуляция.

.

Любой символ, за исключением символов \n и \r.

\s

Все пробельные символы (символ пробела, символы \n, \r и \t).

\S

Все непробельные символы.

\i

Начальные символы имени XML (буква, символы "_" или ":").

\I

Все символы, которые не являются начальными символами имени XML.

\c

Символы имени XML (буква, цифра, символы "_", "-", "." и ":").

\C

Все символы, которые не являются символами имени XML.

\d

Цифры.

\D

Все символы, которые не являются цифрами.

\w

Символ буквы или цифры.

\W

Все символы, не являющиеся буквами и цифрами.

\p{isблок}

Все символы Unicode, принадлежащие данному блоку кодировки, например, \p{isBasicLatin} – все символы, принадлежащие базовому латинскому блоку кодировки или \p{isCyrillic} – все символы, принадлежащие блоку кодировки кириллицы.

\p{L}

Все буквы.

\p{Lсвойство}

Уточнение \p{L}. Допустимы следующие значения свойства: u – верхний регистр, l – нижний регистр, t – заголовок, m – модификатор, o – другое.

\p{M}

Все метки.

\p{Mсвойство}

Уточнение \p{M}. Допустимы следующие значения свойства: n – непробельные, c – пробельные комбинированные, e – закрывающие.

\p{N}

Все цифры.

\p{Nсвойство}

Уточнение \p{N}. Допустимы следующие значения свойства: d – десятичная цифра, l – буква, o – другое.

\p{P}

Все знаки пунктуации.

\p{Pсвойство}

Уточнение \p{P}. Допустимы следующие значения свойства: c – коннектор, d – тире, s – открывающий, е – закрывающий, i – начальная кавычка, f – конечная кавычка, o – другое.

\p{Z}

Все разделители.

\p{Zсвойство}

Уточнение \p{Z}. Допустимы следующие значения свойства: s – пробел, l – строка, p – абзац.

\p{S}

Все символы.

\p{Sсвойство}

Уточнение \p{S}. Допустимы следующие значения свойства: m – математический, c – валюта, k – модификатор, o – другое.

\p{C}

Все другое.

\p{Cсвойство}

Уточнение \p{C}. Допустимы следующие значения свойства: c – управление, f – формат, o – личное использование, n – не определено.

Соседние файлы в папке Лабы