Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Не работает вырезание текста...
 
 автор: Shorr Kan   (06.08.2006 в 04:39)   письмо автору
 
 


<td valign="top" class="view_td3">
текст текст текст....  <b>текст<br />   </b> текст текст тектс<div align="right">
            <a href="reply.php" class="view_a1">Цитировать</a>&nbsp;
            </div>
</td>

Это пример. Вся страничка состоит из такого... Мне нужно получить весь текст, между <td valign="top" class="view_td3"> и <div align="right">

Делаю так:


<?
$pattern
='|<td valign="top" class="view_td3">(.*)<div align="right">|i'
$text=preg_match_all($pattern,$forum,$link);
print 
count($link[1]);
?>

Получаю ноль. Почему?

   
 
 автор: cheops   (06.08.2006 в 11:52)   письмо автору
 
   для: Shorr Kan   (06.08.2006 в 04:39)
 

Попробуйте пробелы заменить на [\s]+, так как русский пробел не соответствует зачастую английскому.

   
 
 автор: Shorr Kan   (06.08.2006 в 15:02)   письмо автору
 
   для: cheops   (06.08.2006 в 11:52)
 

Если я вас правильно понял:

$pattern='|<td valign="top"[\s]+class="view_td3">(.*)<div[\s]+align="right">|i'; 

?
Не работает. Вовсе.

p.s. Насколько я понимаю, он неверно определяет <div align="right"> . Потому как таких блоков текста - там десятки. А он выдрал с первого, до упора (до конца странички). Это в прошлом варианте. В варианте с [\s]+ - он совсем погрустнел...

   
 
 автор: cheops   (06.08.2006 в 15:26)   письмо автору
 
   для: Shorr Kan   (06.08.2006 в 15:02)
 

Тогда используйте ваш первый вариант, но добавьте модификаторы s и U, т.е.
<? 
$pattern
='|<td valign="top" class="view_td3">(.*)<div align="right">|isU';  
$text=preg_match_all($pattern,$forum,$link); 
print 
count($link[1]); 
?>

   
 
 автор: Shorr Kan   (06.08.2006 в 15:41)   письмо автору
 
   для: cheops   (06.08.2006 в 15:26)
 

О! Сработало. Что они делают?

   
 
 автор: cheops   (06.08.2006 в 16:07)   письмо автору
 
   для: Shorr Kan   (06.08.2006 в 15:41)
 

s - сообщает, что соответствие может располагаться на нескольких строках, по умолчанию, соответствие ищется только в пределах строки.
U - инвертирует "жадность" регулярных выражений. Дело в том, что регулярные выражения по умолчанию "жадные", т.е. ищут наиболее длинное соответствие, U - позволяет сделать их "не жадными", т.е. искать наиболее короткое соответствие.

   
 
 автор: Shorr Kan   (06.08.2006 в 16:15)   письмо автору
 
   для: cheops   (06.08.2006 в 16:07)
 

Спасибо. Получается, дело было в s.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования