Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Символ \p Property в регулярном выражении
 
 автор: Deed   (13.02.2011 в 10:05)   письмо автору
 
 

Нашел интересную регулярку:
/[^\w\pL_-]/u
Она служит для вырезание из строки в UTF-8 всех символов, не являющихся знаками алфавита.
Например, в строке
"русский: привет мир, арабский: مرحبا العالم, иврит: שלום העולם, португальский: Olá mundo, 0123456789 - _"
она вырежет все пробелы, запятые и двоеточия:

$str = preg_replace('/[^\w\pL_-]/u','',$str);

//русскийприветмирарабскийمرحباالعالم
ивритשלוםהעולםпортугальскийOlámundo0123456789-_


Я не понял конструкции "\pL" в этой регулярке.

P.S. Она прекрасна, не правда ли? :)

  Ответить  
 
 автор: Trianon   (13.02.2011 в 11:49)   письмо автору
 
   для: Deed   (13.02.2011 в 10:05)
 

http://ru.php.net/manual/en/regexp.reference.unicode.php

PS. и таки я не понял, в чем шарм.

  Ответить  
 
 автор: Deed   (13.02.2011 в 13:58)   письмо автору
 
   для: Trianon   (13.02.2011 в 11:49)
 

Да, уж. Оценить шарм в кодировке страниц этого сайта невозможно, ибо здесь - windows-1251.
Если же страницы в UTF-8, то данная регулярка корректно работает со всеми существующими видами письма, будь то иврит, арабская вязь или китайские иероглифы.

Нашел ответ на свой вопрос здесь: http://docs.php.net/manual/ru/regexp.reference.unicode.php
Но в суть въезжаю что-то медленно...

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования