Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум (новые сообщения вниз) Структурный форум

тема: Помогите с кодом парсера RSS-ленты

Сообщения:  [1-10]    [11-20]  [21-25] 

 
 автор: cheops   (26.04.2011 в 12:34)   письмо автору
 
   для: rafonets   (26.04.2011 в 12:12)
 

Тогда приведенное выше регулярное выражение должно подойти.

  Ответить  
 
 автор: rafonets   (26.04.2011 в 12:12)   письмо автору
 
   для: cheops   (26.04.2011 в 12:02)
 

У меня выводиться все в таком виде

http://www.liveinternet.ru/users/rss_yugopolis/

Югополис | Новости Краснодара и Краснодарского края :: LiveInternet

rss_yugopolis

-----------------------------------------------------------------------

http://www.liveinternet.ru/users/rss_yugopolis/

41-летний, неоднократно судимый, мужчина подозревается в сексуальном надругательстве над 8-летней девочкой. http://www.yugopolis.ru/news/incidents/2011/04/26/16561

Югополис | Новости Краснодара и Краснодарского края

-----------------------------------------------------------------------

http://www.liveinternet.ru/users/rss_yugopolis/post163377028/

В Стамбуле завершился чемпионат Европы по дзюдо. Сборная России, которая была представлена здесь сильнейшим составом, завоевала восемь медалей. http://www.yugopolis.ru/news/sport/2011/04/26/16560

В Краснодарском крае задержан педофил

-----------------------------------------------------------------------

Надо эти ссылки вытащить и ихний html получить дальше через strip_tags оставить только текст и добавить в базу данных поле story вместе с description линк дальше не нужен title нужен

  Ответить  
 
 автор: cheops   (26.04.2011 в 12:02)   письмо автору
 
   для: rafonets   (26.04.2011 в 11:57)
 

А какие части хотите извлечь? Я бы стал отталкиваться от следующего регулярного выражения
<?php
  $url 
"http://www.liveinternet.ru/users/rss_yugopolis/post163377027/";
  
preg_match("|http://www.liveinternet.ru/users/([^/]+)/(post[0-9]+)/|"$url$out);
?>

  Ответить  
 
 автор: rafonets   (26.04.2011 в 11:57)   письмо автору
 
   для: cheops   (26.04.2011 в 11:35)
 

Еще одна просьба

какое регулярное ворожение нужно
http://www.liveinternet.ru/users/rss_yugopolis/post163377027/
/rss_yugopolis/ может быть любое число и все такое наверное так да

preg_match_all("\http://www.liveinternet.ru/users/(.*)/post[0-9]/\/")

Так?

  Ответить  
 
 автор: rafonets   (26.04.2011 в 11:51)   письмо автору
 
   для: cheops   (26.04.2011 в 11:35)
 

Благодарю пока все работает дальше буду программировать )

  Ответить  
 
 автор: cheops   (26.04.2011 в 11:35)   письмо автору
 
   для: rafonets   (26.04.2011 в 11:32)
 

Вообще-то результаты preg_match_all() следует обрабатывать в цикле, давайте изменим скрипт следующим образом
<?php
  
...
  for(
$i 0$i count($title[1]); $i++)
  {
    
print_r("<h3>".$title[1][$i]."</h3>"); 
    
print_r("<p>".$description[1][$i]."</p><br /><hr><br />");
  }
  ...
?>

  Ответить  
 
 автор: rafonets   (26.04.2011 в 11:32)   письмо автору
 
   для: cheops   (26.04.2011 в 11:30)
 


<h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br /><h3>Array</h3><p>Array</p><br /><hr><br />

  Ответить  
 
 автор: rafonets   (26.04.2011 в 11:30)   письмо автору
 
   для: cheops   (26.04.2011 в 11:27)
 

не for начал работать уже только теперь я не могу вывести следующее

if(empty($ahref[$i])) continue;
    $rsscontent = file_get_contents($ahref[$i]);
Здесь все окей а вот ниже (((
    preg_match_all("/<title>(.+?)<\/title>/is",$rsscontent,$title);
    preg_match_all("/<link>(.+?)<\/link>/is",$rsscontent,$title);
    preg_match_all("/<description>(.+?)<\/description>/is",$rsscontent,$description);
    $count=count($title[1])-1;
    for($i=0;$i<30;$i++){
        print_r("<h3>".$title."</h3>");
        print_r("<p>".$description."</p><br /><hr><br />");




  Ответить  
 
 автор: cheops   (26.04.2011 в 11:30)   письмо автору
 
   для: rafonets   (26.04.2011 в 11:28)
 

Вот эти строки
print_r("<h3>".$title."</h3>"); 
print_r("<p>".$description."</p><br /><hr><br />");
замените следующими
print_r("<h3>".$title[1]."</h3>"); 
print_r("<p>".$description[1]."</p><br /><hr><br />");

  Ответить  
 
 автор: rafonets   (26.04.2011 в 11:28)   письмо автору
 
   для: rafonets   (26.04.2011 в 11:23)
 

теперь я получаю то что надо )
но как обрезать title и description я пробую рег выражениями что вы мне дали только получаю array

  Ответить  

Сообщения:  [1-10]    [11-20]  [21-25] 

Форум разработан IT-студией SoftTime
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования