|
|
|
| Здравствуйте,
Подскажите пожалуйста алгоритм по созданию PHP скрипта который считает количество страниц сайта. Готовый скрипт или тот который нужно изменить было бы еще лучше.
Получается PHP-робот должен обойти все внутренние страницы сайта и подсчитать количество ссылок на определенном уровне вложенности.
Для меня единствинное не понятно только как спарсить только ссылки на внутренние страницы сайта? Не подскажите? | |
|
|
|
|
|
|
|
для: volodumir
(07.02.2012 в 01:48)
| | Общий алгоритм такой. Вы пишите функцию, которая принимает ссылку и текущий уровень вложенности, загружает указанную ссылку, выбирает с нее все ссылки и в цикле все их перебирает рекурсивно запуская сама себя увеличив уровень вложенности на 1.
> Для меня единствинное не понятно только как спарсить только ссылки на внутренние страницы сайта?
Просто перед запуском рекурсии по каждой ссылке нужно проверить чтоб она была внутренней, т.е. начиналась либо не с http:// либо с http://vash_domen.zona/
Кстати, если у вас на страницах относительные ссылки, т.е. /papka/fajl.ext либо ./papka/fajl.ext либо ../papka/fajl.ext и т.д., то в рекурсию нужно передавать еще базу, т.е. начало ссылки, чтоб приводить эти относительные ссылки к общему виду: http://domen/papka/papka2/fajl.ext | |
|
|
|
|
|
|
|
для: Sfinks
(07.02.2012 в 10:06)
| | Огромное спасибо. | |
|
|
|