Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Регулярные выражения: разбор страниц форума
 
 автор: danrock   (17.05.2013 в 00:23)   письмо автору
 
 

Привет все, дорогие форумчане. Сегодня я тут первый день Прошу помочь с регулярным выражением.rnrnЧто мне собственно нужно
1)Я хочу написать небольшой парсер аналогичного форума.
2)Я начулися брать контент сайта и возвращать его себе на локалхост
Вот пример кода ,не пинайте сильно :)
<?php
include_once('simple_html_dom.php');
header('Content-Type: text/html; charset=utf-8');
$html file_get_html('[url]hackersoftочкаru[/url]');
echo 
"<table border=10>";
foreach(
$html->find('div[id=content]') as $element)      
echo 
$o[1],$element->innertext '<br>'echo "</table>";
?>
Вот ^ код ,тырит информацию с нужного дива ,и выводит его ,но суть парсера не в этом !Я хочу чтобы парсило темы сайта

Тоесть мне нужно увидеть главную страницу(что я реализовал),далее иметь возможность переходить в разделы (темы|пример ссылки:'hackersoftочкаru/talk/2565/)

б)Очень важный пункт ,я собираюсь парсить контент с этого сайта ,не для того чтобы получить профит итд,а я хочу поменять верстку сайта + сделаь мобильный интерфейс,причем я очень хорошо знаю админа сайта("kanaris")и готов предоставить доказательства.

Может возникнуть вопрос -"почему бы не попросить исходник ?".Дело в том что я + ко всему хочу понять технологию парсинга.rnrnМне важно не получить от вас код ,а получить знания ,буду очень рад если кто-то поможет :)
Заранее спасибо !

PS:Почему я запилил тему в этот раздел,а потому что с помощью регулярок ,как я понял можно вытаскивать темы...

  Ответить  
 
 автор: Саня   (17.05.2013 в 19:10)   письмо автору
 
   для: danrock   (17.05.2013 в 00:23)
 

Можно вытащить селектором:

<?php
$html
->find('h1[id=lf_h1]');


Знания можно получить из документации на сайте http://php.net/pcre.

Так же рекомендую к прочтению книгу Регулярные выражения. Это если хочется понять как работают регулярные выражения.

Если что-то будет не получаться — пишите сюда на форум. Подскажем.

В вашем случае регулярное выражение получится очень простым.

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования