Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
модуль пхп.doc
Скачиваний:
7
Добавлен:
29.08.2019
Размер:
713.22 Кб
Скачать

Жадные и ленивые квантификаторы в регулярных выражениях

Я когда-то писал о квантификаторах повторений. Так вот, мы с Вами там рассмотрели только "жадных" представителей. Однако, не всегда их "жадность" нам помогает, очень часто она и вредит. Чуть ниже я покажу пример, где чётко видно то, что они иногда делают, а также покажу как уменьшить их пыл и сделать квантификаторы повторений "ленивыми".

Давайте разберём простой и уже ставший классическим пример:

<?php   $str = "Небольшая <b>строка</b> c <b>жирным</b> выделением.";   $result_str = preg_replace("/<b>.*<\/b>/i", "здесь_жирное_выделение", $str);   echo $result_str; ?>

Возможно, Вы ожидаете что-то наподобие этого: "Небольшая здесь_жирное_выделение с здесь_жирное_выделение выделением". То есть просто замена содержимого внутри тега <b> на заданную нами строку вместе с самим тегом. Однако, это не совсем так, поскольку здесь вступает в игру "жадность квантификаторов". И в результате замена была не внутри каждого тега <b>, а от самого первого открывающего тега до самого последнего закрывающего. В этом и состоит жадность.

Вот как надо писать данный код, чтобы замена происходила так, как мы хотим:

<?php   $str = "Небольшая <b>строка</b> c <b>жирным</b> выделением.";   $result_str = preg_replace("/<b>.*?<\/b>/i", "здесь_жирное_выделение", $str);   echo $result_str; ?>

Всё, что мы изменили это регулярное выражение, поставив после квантификатора повторений ".*" знак вопроса, который как раз и делает квантификатор "ленивым". Теперь результатом будет: "Небольшая здесь_жирное_выделение c здесь_жирное_выделение выделением.", чего мы и пытались добиться.

Я очень надеюсь, что Вы осознали проблему "жадности" квантификаторов и поняли, как они работают. А также осознали, как это можно исправить простым знаком "?". Эта тема действительно важная, и огромное количество новичков в регулярных выражениях делают одни и те же ошибки, связанные с "жадностью" квантификаторов повторений, поэтому если Вы ещё не осознали весь смысл до конца, то перечитайте статью ещё раз.

Функции для работы с регулярными выражениями

PHP поддерживает два вида записи регулярных выражений: POSIX и Perl. POSIX расшифровывается как Portable Operating System Interface (интерфейс переносной операционной системы) и является стандартом для интерфейсов приложений. В этом разделе мы будем работать с регулярными выражениями в стиле POSIX, а позже рассмотрим Perl-совместимые регулярные выражения.

В общем случае, функции для работы с регулярными выражениями выполняются более медленно, чем строковые функции, предоставляющие аналогичные возможности. Поэтому, если можно без ущерба для эффективности приложения использовать строковые функции, их следует использовать.

ereg()

bool ereg(string pattern, string string [, array regs])

Данная функция ищет в строке string соответствие регулярному выражению, заданному в шаблоне pattern. Если соответствия подвыражений с шаблоном будут найдены, то они сохраняются в массиве соответствий regs. При этом $regs[0] содержит копию строки string, $regs[1] содержит подстроку, начинающуюся с первой левой скобки, $regs[2] хранит подстроку, начинающуюся со второй левой скобки и т.д.

Ниже приведен код, преобразующий дату из формата YYYY-MM-DD в формат DD.MM.YYYY.

<?

$date = "2003-03-21";

if (ereg ("([0-9]{4})-([0-9]{1,2})-([0-9]{1,2})", $date, $regs))

{

echo "$regs[3].$regs[2].$regs[1]";

}

else

{

echo "Неверный формат даты: $date";

}

?>

ereg_replace()

string ereg_replace(string pattern, string replacement, string string)

Эта функция заменяет найденный в строке string шаблон pattern на строку replacement и, если соответствие было найдено, возвращает модифицированную строку.

Одной из частых ошибок при замене числовых значений является указание числа как типа, отличного от строкового, что приводит к неверному результату. Синтаксис функции таков, что число обязательно должно быть записано как строка.

<?

$number = "1952";

$str = "Он родился в пятьдесят втором.";

echo("до замены:$str");

$str = ereg_replace("пятьдесят втором", $number, $str);

echo("<br> после замены: $str");

?>

Результат:

до замены: Он родился в пятьдесят втором.

после замены: Он родился в 1952.

eregi()

bool eregi (string pattern, string string[, array regs])

Эта функция идентична функции ereg, за исключением того, что она игнорирует регистр.

eregi_replace()

string eregi_replace (string pattern, string replacement, string string)

Функция аналогична функции ereg_replace, за исключением того, что она является нечувствительной к регистру.

split()

array split (string pattern, string string [, int limit])

Эта функция возвращает массив строк, которые представляют собой подстроки строки string, образованные в результате разделения строки string на подстроки в соответствии с регулярным выражением pattern. Если указан необязательный параметр limit, то в возвращаемом массиве будет не больше limit элементов, последний из которых содержит неразделенную часть строки.

Эта функция полезна при разделении дат, доменных имен и т.д.

К примеру:

<?

$url = "www.softtime.ru";

$array = split ("\.", $url);

foreach($array as $index => $val)

{

echo("$index -> $val <br />");

}

?>

Результат:

0 -> www

1 -> softtime

2 -> ru

То же самое можно проделать с датой:

<?

$date = "10-12-2003";

$array = split ("-", $date);

foreach($array as $index => $val)

{

echo("$index -> $val <br />");

}

?>

Результат:

0 -> 10

1 -> 12

2 -> 2003

spliti()

array spliti (string pattern, string string [, int limit])

Эта функция аналогична функции split, за исключением того, что является нечувствительной к регистру.