|
|
|
| Ну а как можно вытащить из сайта какой-то блок информации?
Например колонку новостей? Нужно именно с конкретного..информеры не предлагайте)
Я так понимаю, что можно воспользоваться ПХП или ЯВАСКРИПТ.. в обоих использовать регулярные выражения?
Например в искомом тексте.. найти(получить номер первого символа) стабильный(неизменяющийся) блок и найти его позицию. Потом вырезать кусок текста до него. С куском после блока поступить так же. Что скажете? | |
|
|
|
|
|
|
|
для: vovik_sumy
(25.11.2005 в 02:06)
| | Если нужно с конкретного то конкретный пример и приводите. Нет универсального скрипта, который бы парсил все и вся. Делается это все с помощью как вы уже заметили - регулярных выражений, на счет Ява Скрипт.... думаю он вам не пригодится.
Например у нас есть страница http://someurl.com/index.php со след. содержимым:
<html>
<body>
<p class="www">
...
</p>
</body>
</html>
|
и нам надо вывести содержимое находящееся между тегами <p></p>
Скрипт будет выглядеть примерно так:
<?
// загружаем содержимое страницы
$page = file_get_contents("http://someurl.com/index.php");
// вырезаем нужный нам блок
preg_match("/class=\"www\">([\s\S]+)<\/p/iU",$page,$regs);
echo $regs[1];
?>
|
| |
|
|
|
|
|
|
|
для: vovik_sumy
(25.11.2005 в 02:06)
| | Решению подобных задач посвящена каждая вторая тема в разделе Регулярные выражения - вы можете просто воспользоваться поиском, указывая в качестве искомых слов preg_match_all, preg_match и т.п. | |
|
|
|