Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Как лучше открыть большой файл для RegExp?
 
 автор: Qiao   (26.01.2008 в 11:10)   письмо автору
 
 

Мне нужно в текстовом файле размером 50 Мб провести большое количество замен регулярными выражениями.

Опыта работы с файлами мало.
Подскажите, пожалуйста, как лучше всего открыть и на какой стадии проводить замены. Чтобы по скорости лучше (и удобней)?

   
 
 автор: SHAman   (26.01.2008 в 11:29)   письмо автору
 
   для: Qiao   (26.01.2008 в 11:10)
 

А какие там стадии? Можете прогнать регулярками до открытия файла:)

file_get_contents('myfile.txt');

   
 
 автор: kasmanaft   (26.01.2008 в 11:41)   письмо автору
 
   для: SHAman   (26.01.2008 в 11:29)
 

Нуну, 50 мегабайт в памать :)

Смотря какие там регулярки. Если можно, разбейте файл на несколько частей.

   
 
 автор: SHAman   (26.01.2008 в 12:44)   письмо автору
 
   для: kasmanaft   (26.01.2008 в 11:41)
 

ох, не обратил внимания:)

Думаю, зависит от того, что за файл. Есть ли возможность читать его кусками и обрабатывать эти куски?

   
 
 автор: Qiao   (26.01.2008 в 15:09)   письмо автору
 
   для: SHAman   (26.01.2008 в 12:44)
 

Да, такая возможность есть. Так кокой оптимальный размер файла для file_get_contents ?

   
 
 автор: Trianon   (26.01.2008 в 11:48)   письмо автору
 
   для: Qiao   (26.01.2008 в 11:10)
 

Лучше применить один из инструментов, специально предназначенных для решения подобного рода задач.
egrep например.

   
 
 автор: Qiao   (26.01.2008 в 12:17)   письмо автору
 
   для: Trianon   (26.01.2008 в 11:48)
 

То есть лучше всего вручную разбить файл на несколько частей
и далее file_get_contents('myfile.txt'), обрабатывая эту строку и сохранять результат в новый файл.

Регулярные выражения лёгкой и иногда средней сложности. но они массовые.

>Лучше применить один из инструментов, специально предназначенных для решения подобного рода задач.
>egrep например.
Что такое egrep? Программа? Гугль что-то про Линукс лепечет. Под виндоус есть?

   
 
 автор: Trianon   (26.01.2008 в 16:09)   письмо автору
 
   для: Qiao   (26.01.2008 в 12:17)
 

>>Лучше применить один из инструментов, специально предназначенных для решения подобного рода задач.
>>egrep например.
>Что такое egrep? Программа? Гугль что-то про Линукс лепечет. Под виндоус есть?
Конечно.
Например, http://sourceforge.net/projects/unxutils

   
 
 автор: Qiao   (26.01.2008 в 16:38)   письмо автору
 
   для: Trianon   (26.01.2008 в 16:09)
 

А мануал есть какой-нибудь?
Как открыть файл и куда вбить выражения. Чтобы без секса.

И я чувствую, что даже если я всё это запущу, там будут проблемы с иероглифами.
В моём случае php больше подходит.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования