Ну а как можно вытащить из сайта какой-то блок информации?

Главная страница

Создание сайтов

Блог Кузнецова М.В.

Статьи о PHP

PHP-скрипты

Статьи об Apache

Форум С++

Консультации

Форум "Про Жизнь"

Форум:	Форум PHP	Форум Apache	Форум Регулярные Выражения	Форум MySQL	HTML+CSS+JavaScript	Форум Flash	Разное
Новые темы:	0	0	0	0	0	0	0

Здравствуйте, Посетитель!

вид форума:

тема: Ну а как можно вытащить из сайта какой-то блок информации?

следующая тема

предыдущая тема

	автор: vovik_sumy (25.11.2005 в 02:06) письмо автору
	Ну а как можно вытащить из сайта какой-то блок информации? Например колонку новостей? Нужно именно с конкретного..информеры не предлагайте) Я так понимаю, что можно воспользоваться ПХП или ЯВАСКРИПТ.. в обоих использовать регулярные выражения? Например в искомом тексте.. найти(получить номер первого символа) стабильный(неизменяющийся) блок и найти его позицию. Потом вырезать кусок текста до него. С куском после блока поступить так же. Что скажете?

автор: Евгений Петров (25.11.2005 в 02:28) письмо автору

для: vovik_sumy (25.11.2005 в 02:06)

Если нужно с конкретного то конкретный пример и приводите. Нет универсального скрипта, который бы парсил все и вся. Делается это все с помощью как вы уже заметили - регулярных выражений, на счет Ява Скрипт.... думаю он вам не пригодится.

Например у нас есть страница http://someurl.com/index.php со след. содержимым:

<html> <body> <p class="www"> ... </p> </body> </html>

и нам надо вывести содержимое находящееся между тегами <p></p>
Скрипт будет выглядеть примерно так:

<? // загружаем содержимое страницы $page = file_get_contents("http://someurl.com/index.php"); // вырезаем нужный нам блок preg_match("/class=\"www\">([\s\S]+)<\/p/iU",$page,$regs); echo $regs[1]; ?>

	автор: cheops (25.11.2005 в 13:36) письмо автору
	для: vovik_sumy (25.11.2005 в 02:06)
	Решению подобных задач посвящена каждая вторая тема в разделе Регулярные выражения - вы можете просто воспользоваться поиском, указывая в качестве искомых слов preg_match_all, preg_match и т.п.