Шаблон PHP PCRE

#php #regex #unicode #utf-8

#php #регулярное выражение #Юникод #utf-8

Вопрос:

Я хочу понять следующий шаблон, шаг за шагом.

 /p{L}/u
  

/u является модификатором (http://www.php.net/manual/en/reference.pcre.pattern.modifiers.php ):

u (PCRE8) Этот модификатор включает дополнительную функциональность PCRE, которая несовместима с Perl. > Строки шаблона обрабатываются как UTF-8. Этот модификатор доступен с PHP 4.1.0 или более поздней версии > в Unix и с PHP 4.2.3 в win32. Допустимость шаблона в формате UTF-8 проверяется начиная с PHP > 4.3.5.

А как насчет остального? Спасибо.

Ответ №1:

Ознакомьтесь с документацией PHP о escape-последовательностях, чтобы узнать о p{xx} , а затем о свойствах символов в Юникоде, чтобы узнать, что p{L} делает.

Для разработки:

  • u модификатор позволяет использовать escape-последовательности в Юникоде
  • p{xx} является последовательностью Unicode с определенным свойством
  • p{L} это последовательность в Юникоде, которая соответствует букве

Следовательно, /p{L}/u соответствует буквам в Юникоде.