|
|
|
| Короче , нужен скрипт который бы открывал страницу НТМЛ в сети , и искал в ней ссылки одного формата , которые заносил бы в базу данных .
Вот и все , но так как решения не могу придумать (ума не хватает :-) прошу помочь мне чем можно . Заранее спасибо ! | |
|
|
|
|
|
|
|
для: XaZzZi
(11.10.2008 в 21:32)
| | [поправлено модератором] | |
|
|
|
|
|
|
|
для: BinLaden
(11.10.2008 в 21:36)
| | [поправлено модератором] | |
|
|
|
|
|
|
|
для: sim5
(11.10.2008 в 21:38)
| | Я бы сказал спасибо даже за маленькую подсказку , я ж не прошу мне весь скрипт написать .
Просто подскажите как достать с НТМЛ код :) | |
|
|
|
|
|
|
|
для: XaZzZi
(11.10.2008 в 21:41)
| | Какой код? Вам нужны его теги или содержимое страницы (контент)? | |
|
|
|
|
|
|
|
для: sim5
(11.10.2008 в 21:43)
| | мне нужно чтоб с страницы достались теги типа
<html>
<head>
...
</head>
<body>
...
</body>
</html>
|
Вот так . С поиском в тегах я думаю разберусь сам . | |
|
|
|
|
|
|
|
для: XaZzZi
(11.10.2008 в 21:46)
| | Если вам необходимы только адреса ссылок, ну или весть таг А, то вам надо в раздел рег. выражений. Мне так кажется вам такое нужно. А уж конкретно что и как, задать вопрос там.
[поправлено модератором] | |
|
|
|
|
|
|
|
для: sim5
(11.10.2008 в 21:48)
| | [поправлено модератором] | |
|
|
|
|
|
|
|
для: ddhvvn
(11.10.2008 в 22:15)
| | [поправлено модератором] | |
|
|
|
|
|
|
|
для: sim5
(11.10.2008 в 22:20)
| | Вот именно ! Нужен адрес ссылки , но только типа <a href=12345 id=3>TEKST</a>
Но вот как получит НТМЛ код документа в виде строки ? С рег. выражениями я и сам разберусь . | |
|
|
|
|
|
|
|
для: XaZzZi
(12.10.2008 в 09:11)
| | Ну получить HTML код страницы в виде строки не проблема, хватит одной функции file_get_contents(), но вам нужен не код ее и не содержимое, а только url ссылок на ней, то есть забрать все что равно от <a .... по /a>. Это нужно делать с помощью регулярных выражений, зайдите в соответствующий раздел, там уже готовые примеры есть, возможно вы найдете среди них то, что вам необходимо. | |
|
|
|
|
|
|
|
для: sim5
(12.10.2008 в 09:40)
| | а можете поподробнее эту функцию описать , у меня в самоучителе нет такой ( | |
|
|
|
|
|
|
|
для: XaZzZi
(12.10.2008 в 09:47)
| | file_get_contents() - это ссылка на офицальное руководство по РНР. Можете его скачать себе. | |
|
|
|
|
|
|
|
для: sim5
(12.10.2008 в 09:57)
| | эта функция не работает с сайтом.
на ru.yahoo.com пробовал - все норм.
а с этим не идет. | |
|
|
|
|
|
|
|
для: XaZzZi
(12.10.2008 в 10:34)
| | С каким этим? И что "в этом" вам надо получить? | |
|
|
|
|
|
|
|
для: sim5
(12.10.2008 в 11:02)
| | Уже все работает ... Можно топ закрывать ) Пойду в рег выражения , решать свои проблемы ) | |
|
|
|