|
|
|
| Мне нужно в текстовом файле размером 50 Мб провести большое количество замен регулярными выражениями.
Опыта работы с файлами мало.
Подскажите, пожалуйста, как лучше всего открыть и на какой стадии проводить замены. Чтобы по скорости лучше (и удобней)? | |
|
|
|
|
|
|
|
для: Qiao
(26.01.2008 в 11:10)
| | А какие там стадии? Можете прогнать регулярками до открытия файла:)
file_get_contents('myfile.txt');
|
| |
|
|
|
|
|
|
|
для: SHAman
(26.01.2008 в 11:29)
| | Нуну, 50 мегабайт в памать :)
Смотря какие там регулярки. Если можно, разбейте файл на несколько частей. | |
|
|
|
|
|
|
|
для: kasmanaft
(26.01.2008 в 11:41)
| | ох, не обратил внимания:)
Думаю, зависит от того, что за файл. Есть ли возможность читать его кусками и обрабатывать эти куски? | |
|
|
|
|
|
|
|
для: SHAman
(26.01.2008 в 12:44)
| | Да, такая возможность есть. Так кокой оптимальный размер файла для file_get_contents ? | |
|
|
|
|
|
|
|
для: Qiao
(26.01.2008 в 11:10)
| | Лучше применить один из инструментов, специально предназначенных для решения подобного рода задач.
egrep например. | |
|
|
|
|
|
|
|
для: Trianon
(26.01.2008 в 11:48)
| | То есть лучше всего вручную разбить файл на несколько частей
и далее file_get_contents('myfile.txt'), обрабатывая эту строку и сохранять результат в новый файл.
Регулярные выражения лёгкой и иногда средней сложности. но они массовые.
>Лучше применить один из инструментов, специально предназначенных для решения подобного рода задач.
>egrep например.
Что такое egrep? Программа? Гугль что-то про Линукс лепечет. Под виндоус есть? | |
|
|
|
|
|
|
|
для: Qiao
(26.01.2008 в 12:17)
| | >>Лучше применить один из инструментов, специально предназначенных для решения подобного рода задач.
>>egrep например.
>Что такое egrep? Программа? Гугль что-то про Линукс лепечет. Под виндоус есть?
Конечно.
Например, http://sourceforge.net/projects/unxutils | |
|
|
|
|
|
|
|
для: Trianon
(26.01.2008 в 16:09)
| | А мануал есть какой-нибудь?
Как открыть файл и куда вбить выражения. Чтобы без секса.
И я чувствую, что даже если я всё это запущу, там будут проблемы с иероглифами.
В моём случае php больше подходит. | |
|
|
|