Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Посчитать количество страниц сайта скриптом
 
 автор: volodumir   (07.02.2012 в 01:48)   письмо автору
 
 

Здравствуйте,
Подскажите пожалуйста алгоритм по созданию PHP скрипта который считает количество страниц сайта. Готовый скрипт или тот который нужно изменить было бы еще лучше.
Получается PHP-робот должен обойти все внутренние страницы сайта и подсчитать количество ссылок на определенном уровне вложенности.
Для меня единствинное не понятно только как спарсить только ссылки на внутренние страницы сайта? Не подскажите?

  Ответить  
 
 автор: Sfinks   (07.02.2012 в 10:06)   письмо автору
 
   для: volodumir   (07.02.2012 в 01:48)
 

Общий алгоритм такой. Вы пишите функцию, которая принимает ссылку и текущий уровень вложенности, загружает указанную ссылку, выбирает с нее все ссылки и в цикле все их перебирает рекурсивно запуская сама себя увеличив уровень вложенности на 1.

> Для меня единствинное не понятно только как спарсить только ссылки на внутренние страницы сайта?
Просто перед запуском рекурсии по каждой ссылке нужно проверить чтоб она была внутренней, т.е. начиналась либо не с http:// либо с http://vash_domen.zona/
Кстати, если у вас на страницах относительные ссылки, т.е. /papka/fajl.ext либо ./papka/fajl.ext либо ../papka/fajl.ext и т.д., то в рекурсию нужно передавать еще базу, т.е. начало ссылки, чтоб приводить эти относительные ссылки к общему виду: http://domen/papka/papka2/fajl.ext

  Ответить  
 
 автор: volodumir   (07.02.2012 в 18:49)   письмо автору
 
   для: Sfinks   (07.02.2012 в 10:06)
 

Огромное спасибо.

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования