|
|
|
| Продолжение темы: http://softtime.ru/forum/read.php?id_forum=6&id_theme=37964&page=1
Имелось ввиду вся информация между <TD> если в ней есть таблица ее ненадо как нужную инфу выдерать а нужно только то что между TD находится этой таблице и также если внутри есть еще таблици и так до бесконечности... | |
|
|
|
|
|
|
|
для: sidPR
(22.06.2007 в 16:03)
| | Вот-вот ... Я сначала так и подумал ... Выходит зря ломал моск :-)
Тогда действительно должно подойти последнее рег. выражение из предыдущей темы:
<?php
$text = '<td>
<TABLE>
<TR>
<TD>TEST1</TD>
<TD>TEST2</TD>
</TR>
</TABLE>
</td>';
preg_match_all('#<td[^>]*>(((?!</?td[^>]*>).)*)</td>#is', $text, $regs);
foreach ($regs[1] as $val)
echo $val."\r\n\r\n";
?>
|
ЗЫЖ Может встретиться например такой код: <td>blablabla <table>......</table> </td> - вот чтобы отсюда блаблабла достать, может пригодиться тот рекурсивный шаблон... | |
|
|
|
|
|
|
|
для: kasmanaft
(22.06.2007 в 17:02)
| | а как при этом еще изъятую инфу очищять от HTML тего ? | |
|
|
|
|
|
|
|
для: sidPR
(22.06.2007 в 19:41)
| | Ну, например, функцией strip_tags() | |
|
|
|
|
|
|
|
для: kasmanaft
(22.06.2007 в 21:40)
| | Спасибо огромное! =) | |
|
|
|
|
|
|
|
для: sidPR
(23.06.2007 в 19:43)
| | Всетаки баг есть 500 ошибка часто вылетает при использовании данного регулярного выражения :(
может она цепляется к <script></script> ? внутри ? просто есть некоторые вывода по средством JS на странице может изза этого регулярка не справляется ? | |
|
|
|
|
|
|
|
для: sidPR
(25.06.2007 в 16:09)
| | ДА точно когда сам убираю из кода все <script></script> все работаеть! :) подскажите плиз как можно регулярке сказать чтобы она игнорила <script></script> ?: | |
|
|
|
|
|
|
|
для: sidPR
(25.06.2007 в 16:22)
| | Решил вопрос таким методом
<?php
$content = preg_replace("#<script[^>]*?>.*?</script>#is", "", $regz[1]);
preg_match_all('#<td[^>]*>(((?!</?td[^>]*>).)*)</td>#is', $content, $regs);
?>
|
а подскажите что сюда добавить :
<?php
preg_match_all('#<td[^>]*>(((?!</?td[^>]*>).)*)</td>#is', $content, $regs);
?>
|
чтобы то что она выдерает к примеру <td>Словечко </td>
пробел перед или после слова убирался? | |
|
|
|
|
|
|
|
для: sidPR
(25.06.2007 в 16:54)
| |
#<td[^>]*>\s*(((?!</?td[^>]*>).)*?)\s*</td>#is
|
Или можно воспользоваться функцией trim( ) | |
|
|
|
|
|
|
|
для: kasmanaft
(26.06.2007 в 09:07)
| | Вообще непонятные вещи происходят страници проактически одинаковые попадаются удалены все JS скрипты выдерается только самая необходимая инфа ... но вот фигня на какихто все путем обрабатывается а на какихто сразу прям 500 ошибку выдает ... с чем это свзяанно ума не могу приложить :((((( | |
|
|
|
|
|
|
|
для: sidPR
(27.06.2007 в 00:52)
| | вот кстати на каком именно примере у меня вызывает ошибку это помогите пожлауйста как можно избежать этой ошибки
файл вложен в сообщение.. с кодом на котом возникает 500 ошибка! | |
|
|
|
|
|
|
|
для: sidPR
(27.06.2007 в 01:07)
| | Хм... У мну нормально работает...
Это у Вас с настройками сервера что-то не то... (может быть какой-нить неправильный .htaccess действует) | |
|
|
|
|
|
|
|
для: kasmanaft
(27.06.2007 в 12:47)
| | хм а что конкретно может влиять на такое странное поведение ? :( ....т.к. некоторые у меня на ура работают а вот с этим ошибку дает :( htaccess удалил все бестолку ... | |
|
|
|
|
|
|
|
для: sidPR
(27.06.2007 в 14:04)
| | Да я, сказать по правде, не знаю... Попробуйте создать тему в разделе Apache.. может быть там что-то подскажут. | |
|
|
|