Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Динамические страницы на php не проиндексированы поисковиком
 
 автор: Andron   (26.08.2004 в 02:47)   письмо автору
 
 

Здравствуйте.

Индексный файл состоит из 3-х частей (как описано в теме чуть раньше):
1. Топ - там ссылки стоят стандартные
2. Тело - автоматически генерируется, то есть выбирается из бд и строится на лету.
3. Боттом - аналогично топу.

Сайт = tmland.ru (не реклама =) ). Так вот - странички в новостях и каталоге не попали в поисковик.

Что такое может быть?
Буду признателен за любую помощь, спасибо.

   
 
 автор: glsv (Дизайнер)   (26.08.2004 в 08:54)   письмо автору
 
   для: Andron   (26.08.2004 в 02:47)
 

>Так вот - странички в новостях и каталоге не попали в поисковик. Что такое может быть?

А сколько времени прошло с момента их создания?
Про поисковики ничего определенного сказать нельзя.

У нас вот какая статистика (на основе опыта)

Если сайт известен поисковой системе, то с момента создания новых страниц до их появления в поисковой системе может пройти до 3 месяцев. Средний срок - месяц-полтора.
И очень много факторов когда срок может увеличиваться. В общем - это как гадание на кофейной гуще.

Так что если времени прошло немного, то не стоит даже волноваться.

>Так вот - странички в новостях и каталоге не попали в поисковик.
Кстати, про какой поисковик Вы говорите?

   
 
 автор: cheops   (26.08.2004 в 09:28)   письмо автору
 
   для: glsv (Дизайнер)   (26.08.2004 в 08:54)
 

Чтобы точно быть уверенным индексятся страницы или нет, можно воспользоваться нашей системой сбора и анализа информации по посещениям сайта - PowerCounter.

http://www.softtime.ru/info/downloads.php

   
 
 автор: glsv (Дизайнер)   (26.08.2004 в 21:03)   письмо автору
 
   для: cheops   (26.08.2004 в 09:28)
 

Если точнее, то с помощью системы статистики PowerCounter можно отслеживать посещение сайта поисковыми роботами.

   
 
 автор: Andron   (26.08.2004 в 19:38)   письмо автору
 
   для: glsv (Дизайнер)   (26.08.2004 в 08:54)
 

Да, времени прошло не много. Но дело в том, что некоторые страницы проиндексировались (статические, реально существующие на сервере), а динамические нет.

Но ведь поисковик не знает какая страница перед ним, ведь так?

Поисковик - rambler.

   
 
 автор: glsv (Дизайнер)   (26.08.2004 в 20:59)   письмо автору
 
   для: Andron   (26.08.2004 в 19:38)
 

>Но ведь поисковик не знает какая страница перед ним, ведь так?

Как раз не так. Он прекрасно осведомлен какая у Вас страница (если от него это не скрывать). Если у урла страницы содержит символы ? и &, то по этим признакам поисковик определяет динамическую страницу. Например: http://www.site.ru?id=2&type=3

А как раз Рамблер славится тем, что плохо индексирует динамические страницы. Но все же индексирует. Ждите :)
Ну либо можно попыться обмануть его. У вас есть создавать файлы .htaccess на сервере.

   
 
 автор: Andron   (26.08.2004 в 22:17)   письмо автору
 
   для: glsv (Дизайнер)   (26.08.2004 в 20:59)
 

>Ну либо можно попыться обмануть его. У вас есть создавать
>файлы .htaccess на сервере.

:) А точнее?

P.S. (не по теме) а 8-ка Ваша? Фотка - супер!

   
 
 автор: glsv (Дизайнер)   (27.08.2004 в 00:10)   письмо автору
 
   для: Andron   (26.08.2004 в 22:17)
 

>:) А точнее?

Чтобы обмануть поисковик нужно изменить URL страницы. Вернее реальный адрес страницы остается тем же самым, но обращение к этой странице будет производится через "фиктивный" специально сформированный URL.
Например у вас есть динамическая страничка
http://www.site.ru/index.php?show=white
Тогда этот адрес можно преобразовать вот в такой:
http://www.site.ru/show/white/ , который с точки зрения поисковика является статическим.

Чтобы иметь возможность это делать на сервере должна быть подключен модуль mod_rewrite.
Этот модуль будет преобразовывать URL-ы.
При обращении к несуществующей странице http://www.site.ru/show/white/ запрос будет передан реально существующей странице http://www.site.ru/index.php?show=white
Но ни поисковики ни посетители этого не увидят. Они будут видеть только "статическую" страницу.


Как бы проверить. Включен он или нет....
Давайте так. Создайте файл .htaccess со строками а перепишите его на сервер:


RewriteEngine on
Options +FollowSymlinks


Если сервер не будет выдават ошибку при этом, то mod_rewrite подключен и можно двигаться дальше.

>P.S. (не по теме) а 8-ка Ваша? Фотка - супер!
Моя и я в ней :)

   
 
 автор: Andron   (27.08.2004 в 05:41)   письмо автору
 
   для: glsv (Дизайнер)   (27.08.2004 в 00:10)
 

Записал строчки в файл, он в корне (то есть где главный индексный файл).
При загрузке, ошибки не выдает. Значит mod_rewrite подключен?
И как дальше?
Да, а если больше одного параметра передавать, то будет например так:
http://www.site.ru/show/white/hide/black
=> http://www.site.ru?show=white&hide=black
????
И если что-то на русском передается, как тогда? Не будет проблем?

P.S. (снова не по теме) КЛАС! У меня девятка....

   
 
 автор: glsv (Дизайнер)   (27.08.2004 в 09:08)   письмо автору
 
   для: Andron   (27.08.2004 в 05:41)
 

>Да, а если больше одного параметра передавать, то будет например так:

Вообще то да... с несколькими параметрами некрасиво получается.

Там не только так можно сделать. URL можно какой угодно можно придумать. Тут вот какая проблема - как поисковики определяют что это динамическая страница? Допустим по наличию символа ?. Тогда этот символ можно заменить на какой нибудь другой. Но где гарантия, что определяется только по этому символу. Тут только экспериенты могут помочь. Но это дело долгое - как и все что касается поисковиков :(

Вот содержимое .htaccess, которое заменяет символ ? на символ @
В последней строке регулярное выражение. Таким образом и подмениваются URL-ы.


RewriteEngine on
Options +FollowSymlinks
RewriteBase /
RewriteRule ^(.*)@(.*)$ $1?$2

Т.е. если на сайт придет запрос
http://www.site.ru/index.php@id=2
То этот URL будет модифицирован mod_rewrite и передан в нормальном виде как
http://www.site.ru/index.php?id=2

Открою секрет.
Для нашего справочика функций тоже идет подмена URL-ов

RewriteEngine on
Options +FollowSymlinks
RewriteBase /
RewriteRule ^dic/(.*)$ /bookphp/dic.php?$1
RewriteRule ^group/(.*)$ /bookphp/group.php?$1

При обращении к директориям group и dic обращения на самом деле идут к файлам bookphp/dic.php и bookphp/group.php с передачей параметров.

   
 
 автор: Andron   (27.08.2004 в 14:38)   письмо автору
 
   для: glsv (Дизайнер)   (27.08.2004 в 09:08)
 

Если в файле я пропишу например так:
http://tmland.ru/catalog/catalog.php@id_rubr=15&id_subrubr=1
то и поисковик проиндексрует страничку с символом @. Не очень красиво...
Ну если это только вопрос времени - как знать, когда будут проиндексированы динамические страницы?
И стоит ли игра свеч?

   
 
 автор: glsv (Дизайнер)   (28.08.2004 в 10:29)   письмо автору
 
   для: Andron   (27.08.2004 в 14:38)
 

>Ну если это только вопрос времени - как знать, когда будут проиндексированы динамические страницы?

Внизу по ссылке будет страница рамблера, где есть форма проверка - какие страницы проиндексированы.

Проверил softtime и с удивлением увидел, что уже проиндексированы и попали в базу сегодняшние темы форума :)

>И стоит ли игра свеч?
Мы сами не стали сильно "заморачиваться". То что мы делали с mod_rewrite - это только в порядке эксперимента. В основном все индексируется и довольно неплохо. Индексация проходит постепенно. Приходит робот, читает несколько страниц, собирает ссылки на другие страницы и уходит. В следующий свой заход он пробегает по собранным ранее ссылкам и опять же собирает ссылки на те страницы где его еще не было. Периоды между заходами роботов обычно колеблются от недели до месяца.

   
 
 автор: Dimonti   (30.08.2004 в 06:06)   письмо автору
 
   для: glsv (Дизайнер)   (28.08.2004 в 10:29)
 

У меня такой вопрос по этому Рамблеру и прочим роботам:
Вчера мой сайт просканировали Рамблер и Google (PowerCounter), но в эти поисковики показывают только первую страницу index.php. Но остальные страницы, например pesni.php, увы, остались в тени.
Ссылка в меню такая:
...
<td>&nbsp;<a class=link href="pesni.php" title="Наши фонограммы">Наши фонограммы</a></td>
...
Они (роботы) в теории и на практике понимают такие ссылки а может эффективнее будет прописать полный адрес?
Или всё таки .htaccess?
Страницы составные, но различных символов !"№;%:?*()_!@#$%^&* и т.д. не содержат.

   
 
 автор: glsv (Дизайнер)   (30.08.2004 в 08:27)   письмо автору
 
   для: Dimonti   (30.08.2004 в 06:06)
 

>Вчера мой сайт просканировали Рамблер и Google (PowerCounter), но в эти поисковики показывают только первую страницу index.php.
А, ну это нормально. Там механизм такой: Сначала роботы сканируют все и только через некоторое время проиндексированные страницы появляются в поисковой базе данных. Недели 2 запросто может пройти между этими событиями.

>Они (роботы) в теории и на практике понимают такие ссылки а может эффективнее будет прописать полный адрес?
Нет, не надо - ссылка нормальная и хороша для любого робота.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования