Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Извлечение ссылок со страницы
 
 автор: Pilot   (22.04.2006 в 14:10)   письмо автору
 
 

Помогите, кто нибудь. Пишу поиск, необходимо сделать индексацию для этого надо со всех страниц генерируемых php собрать ссылки между тегами <a href=link>текст</a>, как это сделать? Если кто с этим сталкивался помогите буду очень признателен!!!

   
 
 автор: WebTech   (22.04.2006 в 18:50)   письмо автору
 
   для: Pilot   (22.04.2006 в 14:10)
 

Если обрабатываемый текст находится в $text, то можно так


preg_match_all('%<a\shref="?.*"?>(.*)</a>%', $text, $out, PREG_PATTERN_ORDER)


Результат будет сохранен в двумерном массиве $out следующим образом


$out           0                              1                               2                     ...

  0  <a href="link1">LINK1...</a>  <a href="link2...">LINK2</a>   <a href="link3...">LINK3</a>      ...

  1   первый найденный                 первый найденный                 первый найденный            ...
      фрагмент текста                  фрагмент текста                  фрагмент текста
      между тегами                     между тегами                     между тегами
      <a href="link1"> и </a>          <a href="link2"> и </a>          <a href="link3"> и </a>

  2   второй найденный                 второй найденный                 второй найденный            ...
      фрагмент текста                  фрагмент текста                  фрагмент текста
      между тегами                     между тегами                     между тегами
      <a href="link1"> и </a>          <a href="link2"> и </a>          <a href="link3"> и </a>

  3   третий найденный                 третий найденный                 третий найденный            ...
      фрагмент текста                  фрагмент текста                  фрагмент текста
      между тегами                     между тегами                     между тегами
      <a href="link1"> и </a>          <a href="link2"> и </a>          <a href="link3"> и </a>



и т.д.

Немножко непонятно на первый взгляд, но если посидеть и разобраться, то очень даже ничего :-)

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования