Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Извлечение ссылок и их названий
 
 автор: dima2207   (02.03.2007 в 00:46)   письмо автору
 
 

люди, помогите составить регвыру .
есть хтмл файл , из него нужно извлечь все ссылки , а так-же все названия муз. групп !!!!

   
 
 автор: cheops   (02.03.2007 в 01:11)   письмо автору
 
   для: dima2207   (02.03.2007 в 00:46)
 

Прикрепите файл или укажите ссылку на страницу.

   
 
 автор: dima2207   (02.03.2007 в 02:29)   письмо автору
 
   для: cheops   (02.03.2007 в 01:11)
 

Надо что-бы ссылки выводились ввиде :
ссылка => имя
на примере этого скрипта :
<?php 

$query 
"blablabla"
$page 0
$num 10

$host "www.google.com"
$path "/search.htm?q=$query&start=$page&num=$num"

if ( !
$buffer getdata($host$path) ) { 
    exit(
"Ошибка"); 

if ( !
$links l_parse($buffer) ) { 
    echo 
"Не найдено ссылок"
} else { 
    
print_r($links); 


// функция получения страницы с удаленного хоста. 
function getdata($host$path

     
$buffer true
     
$fp = @fsockopen("tcp://".$host80$errno$errstr10); 
     if (!
$fp) { 
         return 
false
     } else { 
         
$out  "GET $path HTTP/1.1\r\n"
         
$out .= "Host: $host\r\n"
         
$out .= "Referer: $host$path\r\n"
         
$out .= "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)\r\n"
         
$out .= "Connection: Close\r\n"
         
$out .= "\r\n"

         
fwrite($fp$out); 
         while (!
feof($fp)) { 
             
$buffer .= fgets($fp1024); 
         } 
         
fclose($fp); 
     } 
     return 
$buffer


// отделяем ссылки 
// с помощью рег. выражения 
function l_parse($buffer

    
$LinkRegEx "!<a href=\"?'?(http://[^\"'>\s]+)!i"
    
preg_match_all($LinkRegEx$buffer$matches); 
    
$size sizeof($matches[1]); 
    if( empty(
$size) ) 
        return 
false
    for(
$i 0$i $size$i++) { 
        
// этим, мы удаляем лишние ссылки 
        
if( !preg_match("/google|search?q=cache/i"$matches[1][$i]) ) { 
            
$links[] = $matches[1][$i]; 
        } 
    } 
    return 
$links


?> 

   
 
 автор: Бамси   (02.03.2007 в 17:59)   письмо автору
 
   для: dima2207   (02.03.2007 в 02:29)
 

Как скрипт узнает что это название музыкальной группы? :)

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования