|
|
|
| есть список: "&ndash, только, будет, потом, можно, приватности, будут, работают, совсем, «, нужно,"
как коротко и нересурсоёмко удалить все слова начинающиеся на & ? у меня что-то несуразное получается :( | |
|
|
|
|
|
|
|
для: kikaha
(16.04.2008 в 18:34)
| | хоть бы показали что там у вас...
preg_replace("\s&[a-z]+", "", $text);
|
может так? | |
|
|
|
|
|
|
|
для: ddhvvn
(16.04.2008 в 18:36)
| | ммм, почему-то не работает вообще эта конструкция.
если коротко, то есть текст на странице, я его чищу by strip_tags от кода. прогоняю через класс и получаю строку ключевых слов. но поскольку в исходном тексте (все в utf-8) некоторые спецсимволы сконвертированы, и их много, то они тоже попадают в список кейвордов. делать регексп с полным списком спецсимволов лениво и ресурсоёмко, проще убитьслова по признаку - у кого первое & - того и с пляжа... | |
|
|
|
|
|
|
|
для: kikaha
(16.04.2008 в 18:56)
| |
<?php
...
$text = preg_replace("\s&[a-z]+", "", $text);
...
?>
|
| |
|
|
|
|
|
|
|
для: kikaha
(16.04.2008 в 18:56)
| | наверное проще перегнать весь текст через html_entity_decode
<?
$str = '«&"<b>word</b>';
print $str . '<hr>';
print html_entity_decode($str) . '<hr>';
?>
|
| |
|
|
|
|
|
|
|
для: q'n'd
(16.04.2008 в 19:34)
| | сервер был с 4-м php, перекинул на 5-й, вставил код выше, можно посмотреть результат на любой странице сайта, например http://www.legco.net/entry-142.php , в заголовке тег keywords
в общем, помогла html_entity_decode и поднял требования к частоте кейвордов | |
|
|
|