|
|
|
| Нужно из документа (хотя бы строки), содержащего такие строки:
http://newsvm.com .11114.02.2007
http://yarmarka-ryazan.ru - . :
http://pk.awards-su.com
http://cmlt.ru .
http://altpress.ru
http://autobaraholka.ru/Autobaraholka.ru - 11114.02.2007
http://gazetayat.ru . . - .11114.02.2007
Сделать чистый список урлов.
Подскажите, если можете :) | |
|
|
|
|
|
|
|
для: dlinnuke
(15.11.2007 в 02:09)
| | Можно воспользоваться следующим решением
<?php
$contents = file_get_contents("get.txt");
$pattern = "|http:[^\s]+|is";
preg_match_all($pattern, $contents, $out);
echo "<pre>";
print_r($out[0]);
echo "</pre>";
?>
|
| |
|
|
|
|
|
|
|
для: cheops
(15.11.2007 в 02:30)
| | Спасибо. Я в регулярных вообще не шарю, но нужно срочно сделать... :(
Разрезает нормально, но можно ли добиться ещё того, что в строках типа http://robinhood11.narod.ru/robinhood.htm
оставлять только http://robinhood11.narod.ru, т.е. до первого вхождения ru, com, net, biz, ua и т.д.? | |
|
|
|
|
|
|
|
для: dlinnuke
(15.11.2007 в 02:56)
| | добавить к \s ещё /
<?
$pattern = "|http:[^\s\/]+|is";
|
| |
|
|
|
|
|
|
|
для: exp
(15.11.2007 в 03:54)
| | Странно, но так не работает :( | |
|
|
|
|
|
|
|
для: dlinnuke
(15.11.2007 в 07:31)
| |
<?php
$contents = file_get_contents("get.txt");
$pattern = "|http://[^/]+|is";
preg_match_all($pattern, $contents, $out);
echo "<pre>";
print_r($out[0]);
echo "</pre>";
?>
|
| |
|
|
|
|
|
|
|
для: Faraon
(15.11.2007 в 09:40)
| | |http://[^/]+|is - так, наверное, вообще весь текст зохавает.
\s еще добавить надо: |http://[^/\s]+|i
А модификатор "s" можно убрать.. | |
|
|
|
|
|
|
|
для: kasmanaft
(15.11.2007 в 10:11)
| | Спасибо огромное!!
Мне очень помогла Ваша помощь. Век не забуду... :) | |
|
|
|