Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: нужно удалить все слова начинающиеся на &
 
 автор: kikaha   (16.04.2008 в 18:34)   письмо автору
 
 

есть список: "&ndash, только, будет, потом, можно, приватности, будут, работают, совсем, &laquo, нужно,"
как коротко и нересурсоёмко удалить все слова начинающиеся на & ? у меня что-то несуразное получается :(

   
 
 автор: ddhvvn   (16.04.2008 в 18:36)   письмо автору
 
   для: kikaha   (16.04.2008 в 18:34)
 

хоть бы показали что там у вас...


preg_replace("\s&[a-z]+", "", $text);


может так?

   
 
 автор: kikaha   (16.04.2008 в 18:56)   письмо автору
 
   для: ddhvvn   (16.04.2008 в 18:36)
 

ммм, почему-то не работает вообще эта конструкция.
если коротко, то есть текст на странице, я его чищу by strip_tags от кода. прогоняю через класс и получаю строку ключевых слов. но поскольку в исходном тексте (все в utf-8) некоторые спецсимволы сконвертированы, и их много, то они тоже попадают в список кейвордов. делать регексп с полным списком спецсимволов лениво и ресурсоёмко, проще убитьслова по признаку - у кого первое & - того и с пляжа...

   
 
 автор: ddhvvn   (16.04.2008 в 19:24)   письмо автору
 
   для: kikaha   (16.04.2008 в 18:56)
 


<?php
...
$text preg_replace("\s&[a-z]+"""$text);
...
?>

   
 
 автор: q'n'd   (16.04.2008 в 19:34)   письмо автору
 
   для: kikaha   (16.04.2008 в 18:56)
 

наверное проще перегнать весь текст через html_entity_decode
<?
$str 
'&laquo;&amp;&quot;&lt;b&gt;word&lt;/b&gt;';

print 
$str '<hr>';

print 
html_entity_decode($str) . '<hr>';
?>

   
 
 автор: kikaha   (17.04.2008 в 17:24)   письмо автору
 
   для: q'n'd   (16.04.2008 в 19:34)
 

сервер был с 4-м php, перекинул на 5-й, вставил код выше, можно посмотреть результат на любой странице сайта, например http://www.legco.net/entry-142.php , в заголовке тег keywords

в общем, помогла html_entity_decode и поднял требования к частоте кейвордов

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования