#php #regex #unicode #utf-8
#php #регулярное выражение #Юникод #utf-8
Вопрос:
Я хочу понять следующий шаблон, шаг за шагом.
/p{L}/u
/u является модификатором (http://www.php.net/manual/en/reference.pcre.pattern.modifiers.php ):
u (PCRE8) Этот модификатор включает дополнительную функциональность PCRE, которая несовместима с Perl. > Строки шаблона обрабатываются как UTF-8. Этот модификатор доступен с PHP 4.1.0 или более поздней версии > в Unix и с PHP 4.2.3 в win32. Допустимость шаблона в формате UTF-8 проверяется начиная с PHP > 4.3.5.
А как насчет остального? Спасибо.
Ответ №1:
Ознакомьтесь с документацией PHP о escape-последовательностях, чтобы узнать о p{xx}
, а затем о свойствах символов в Юникоде, чтобы узнать, что p{L}
делает.
Для разработки:
u
модификатор позволяет использовать escape-последовательности в Юникодеp{xx}
является последовательностью Unicode с определенным свойствомp{L}
это последовательность в Юникоде, которая соответствует букве
Следовательно, /p{L}/u
соответствует буквам в Юникоде.