Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Ограничение строки.
 
 автор: nax   (15.04.2008 в 10:26)   письмо автору
 
 

Мне нужно из множества текстовых файлов (от 20 до 500 кб) вытянуть все тексты, находящиеся в теге <pre>. В каждом файле встречается этот тег только 1 раз. Я получаю все файлы нужной мне папки и с каждым делаю так:

preg_match_all('/<pre>(.*)<\/pre>/Usi', $content, $CleanContent);


Этот код должен вытягивать текст между тегами <pre> в строке $content, получанной функцие file_get_contents. Если текст между этими тегами меньше 65 - 100 кб, то всё впорядке, но если больше, то работать отказывается.

Тоесть изначально, когда текст около 20 кб, всё работает, я искусственно размножаю один и тот же текст много раз внутри нужного тега, пока он не будет около 100 кб, и на выходе получаю пустой массив. Срабатывает какой-то ограничитель чтоли. Ошибок никаких не выдается. Подскажите, что делать.

   
 
 автор: cheops   (15.04.2008 в 12:20)   письмо автору
 
   для: nax   (15.04.2008 в 10:26)
 

Вы бы не могли прикрепить к сообщению файл в котором регулярное выражение не срабатывает, чтобы можно было воспроизвести ситуацию?

   
 
 автор: nax   (15.04.2008 в 12:36)   письмо автору
272 Кб
 
   для: cheops   (15.04.2008 в 12:20)
 

Конечно. Файл прикрепил. 273 кб.

Скрипт буквально такой:

<?php
$content 
file_get_contents('D:\2hitch.html');
preg_match_all('/<pre>(.*)<\/pre>/Usi'$content$CleanContent);
print_r($CleanContent);
?>


Выводит пустой массив, пока я не "укорочу" этот файл до 80 кб. И так со всеми файлами.

   
 
 автор: cheops   (15.04.2008 в 13:03)   письмо автору
 
   для: nax   (15.04.2008 в 12:36)
 

Хм... действительно, оказывается в библиотеке PERL-совместимых регулярных выражений имеется ограничение на количество символов (65536 символов).

http://www.pcre.org/pcre.txt

   
 
 автор: nax   (15.04.2008 в 13:11)   письмо автору
 
   для: cheops   (15.04.2008 в 13:03)
 

Спасибо большое. Странно, что разработчики PHP не удосужились сделать вывод нотайса, я уж начал копаться в php.ini, думал, памяти какой-то не хватает.

Буду использовать строковые функции.

   
 
 автор: AcidTrash   (15.04.2008 в 13:17)   письмо автору
 
   для: nax   (15.04.2008 в 12:36)
 

А если попробовать так, убрать модификатор U
preg_match_all('/<pre>(.*)<\/pre>/si', $content, $CleanContent);

   
 
 автор: nax   (15.04.2008 в 13:24)   письмо автору
 
   для: AcidTrash   (15.04.2008 в 13:17)
 

Оппа, работает :)

   
 
 автор: cheops   (15.04.2008 в 14:08)   письмо автору
 
   для: AcidTrash   (15.04.2008 в 13:17)
 

Судя по всему ограничение касается на количество искомых символов, когда поиск ведётся с конца - регулярные выражения не сталкиваются с ограничением
preg_match_all('/<pre>(.*)<\/pre>/si', $content, $CleanContent);

когда с начала - сталкиваются - например, следующее выражение тоже не будет работать
preg_match_all('/<pre>(.*?)<\/pre>/si', $content, $CleanContent);

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования