Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Запрос страницы и анализ ее содержимого с занесением в базу
 
 автор: Snorri   (05.06.2006 в 09:13)   письмо автору
 
 

Здравствуйте.
Как можно при помощи PHP затребовать некую страницу и анализировать ее содержимое, т.е получить переменную содержащую HTML код страницы?.
Нужно комбинировать с JavaScript?
Вообще задача следующая: написать скрипт, который запрашивает страницу, а далее разбирает ее на кусочки и заносит эти кусочки в базу .
Понимаю что это задача моя и не прошу кого-нибудь ее решать полностью и выкладывать здесь готовый скрипт, просто помочь наметить подходы или указать ссылку на материал имееющий отношение к делу или указать общую схему решения этой задачи с указанием функций.
Заранее благодарен.

   
 
 автор: cheops   (05.06.2006 в 09:53)   письмо автору
 
   для: Snorri   (05.06.2006 в 09:13)
 

Да это возможно (можно обойтись без JavaScript) - обычно для этого загружают страницу при помощи файловых функций, например
<?php
  $str 
file_get_conents("http://www.mysite.ru");
?>

$str будет присвоено содержимое HTML-кода страницы и затем разобрать код при помощи регулярных выражений. Такой задаче посвящена каждая третья тема форума по Регулярным выражениям.

   
 
 автор: Snorri   (05.06.2006 в 10:29)   письмо автору
 
   для: cheops   (05.06.2006 в 09:53)
 

Отдельное огромное спасибо Cheops' у.
Содержимое страницы получаем get_file_content();
то что нужно забираем preg_match_all();
далее дело техники!

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования