|
|
|
| Мне нужно из множества текстовых файлов (от 20 до 500 кб) вытянуть все тексты, находящиеся в теге <pre>. В каждом файле встречается этот тег только 1 раз. Я получаю все файлы нужной мне папки и с каждым делаю так:
preg_match_all('/<pre>(.*)<\/pre>/Usi', $content, $CleanContent);
|
Этот код должен вытягивать текст между тегами <pre> в строке $content, получанной функцие file_get_contents. Если текст между этими тегами меньше 65 - 100 кб, то всё впорядке, но если больше, то работать отказывается.
Тоесть изначально, когда текст около 20 кб, всё работает, я искусственно размножаю один и тот же текст много раз внутри нужного тега, пока он не будет около 100 кб, и на выходе получаю пустой массив. Срабатывает какой-то ограничитель чтоли. Ошибок никаких не выдается. Подскажите, что делать. | |
|
|
|
|
|
|
|
для: nax
(15.04.2008 в 10:26)
| | Вы бы не могли прикрепить к сообщению файл в котором регулярное выражение не срабатывает, чтобы можно было воспроизвести ситуацию? | |
|
|
|
|
 272 Кб |
|
|
для: cheops
(15.04.2008 в 12:20)
| | Конечно. Файл прикрепил. 273 кб.
Скрипт буквально такой:
<?php
$content = file_get_contents('D:\2hitch.html');
preg_match_all('/<pre>(.*)<\/pre>/Usi', $content, $CleanContent);
print_r($CleanContent);
?>
|
Выводит пустой массив, пока я не "укорочу" этот файл до 80 кб. И так со всеми файлами. | |
|
|
|
|
|
|
|
для: nax
(15.04.2008 в 12:36)
| | Хм... действительно, оказывается в библиотеке PERL-совместимых регулярных выражений имеется ограничение на количество символов (65536 символов).
http://www.pcre.org/pcre.txt | |
|
|
|
|
|
|
|
для: cheops
(15.04.2008 в 13:03)
| | Спасибо большое. Странно, что разработчики PHP не удосужились сделать вывод нотайса, я уж начал копаться в php.ini, думал, памяти какой-то не хватает.
Буду использовать строковые функции. | |
|
|
|
|
|
|
|
для: nax
(15.04.2008 в 12:36)
| | А если попробовать так, убрать модификатор U
preg_match_all('/<pre>(.*)<\/pre>/si', $content, $CleanContent);
|
| |
|
|
|
|
|
|
|
для: AcidTrash
(15.04.2008 в 13:17)
| | Оппа, работает :) | |
|
|
|
|
|
|
|
для: AcidTrash
(15.04.2008 в 13:17)
| | Судя по всему ограничение касается на количество искомых символов, когда поиск ведётся с конца - регулярные выражения не сталкиваются с ограничением
preg_match_all('/<pre>(.*)<\/pre>/si', $content, $CleanContent);
|
когда с начала - сталкиваются - например, следующее выражение тоже не будет работать
preg_match_all('/<pre>(.*?)<\/pre>/si', $content, $CleanContent);
|
| |
|
|
|