Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Поисковики и Базы данных?
 
 автор: Boris   (27.06.2005 в 13:31)   письмо автору
 
 

Добрый день!
Я вот не могу понять, как поисковые системы (Rambler, Yandex и т.д.) индексируют страницы сайта, в основе которого лежат таблицы базы данных.
Ведь страница "собирается" из разных кусочков в прцессе просмотра ее пользователем.
А так приходит робот и видит набор файлов с кодом PHP и запросами MySQL.
Как он выбирает META-данные и т.д., неужели выполняет SQL запросы и "собирает" для себя готовые страницы, а потом их индексирует?

   
 
 автор: cheops   (27.06.2005 в 13:36)   письмо автору
 
   для: Boris   (27.06.2005 в 13:31)
 

На самом деле, роботы поисковых систем не копаются в PHP-коде, им его никто не предоставляет - они видят то, что видят обычные посетители - цельную HTML-страницу.

   
 
 автор: Boris   (27.06.2005 в 13:39)   письмо автору
 
   для: cheops   (27.06.2005 в 13:36)
 

А как они видят HTML-страницу если ее нет на сервере, откуда она появляется?

   
 
 автор: DJ Paltus   (27.06.2005 в 13:41)   письмо автору
 
   для: Boris   (27.06.2005 в 13:39)
 

Бот - тот же человек, для сервера. Он приходит, браузит страницу, а потом анализирует выданный ему ХТМЛ-код. Обращается к сайту как простой смертный.

   
 
 автор: Boris   (27.06.2005 в 13:44)   письмо автору
 
   для: DJ Paltus   (27.06.2005 в 13:41)
 

Ага, понял!
Спасибо! А то я начал было беспокоится :)

   
 
 автор: XPraptor   (27.06.2005 в 19:04)   письмо автору
 
   для: Boris   (27.06.2005 в 13:44)
 

Правильно начал! Если у тебя под одним и тем же адресом генерится каждый раз разный набор данных то поисковики в мануале так и пишут: Зачем индексировать такие страницы, если завтра их уже не будет? Создайте локальную html компию и добавьте ее для индексации. Вона как!

   
 
 автор: cheops   (27.06.2005 в 21:08)   письмо автору
 
   для: XPraptor   (27.06.2005 в 19:04)
 

Всё-равно индексируют... например главную страницу этого форума индексируют, несмотря на то, что она меняется каждый день.

   
 
 автор: XPraptor   (29.06.2005 в 02:34)   письмо автору
 
   для: cheops   (27.06.2005 в 21:08)
 

На счет индексируют - они не могут не индексировать, раз страница есть и на нее есть ссылка.
На моем портале (www.inteerss.ru) все страницы разделов с объявлениями генерятся из базы динамически и ключевые слова автоматом составляются на основе максимального кол-ва слов на текущей странице, и описания тоже автосоздаются, поэтому там в течение дня уже всегда разный контент под одним адресом. И именно это и было моей самой грубой ошибкой, вес таким страницам поисковики дают минимальный, они контенту этих страниц у себя в кэше и то больший вес присваивают, чем обновленной версии страницы.

Такой глупостью я убил себе поисковый трафик напрочь. Теперь переделываю всю структуру портала как у org.torgcenter.ru. Они сразу грамотно забомбили - сразу объява генерится в отдельный html файл который сохраняется на хосте и автоматом заносится в пять основных поисковиков для индексации как новый сайт (или страница сайта). Уже заканчиваю дописание, осталось сгенерить файлы на уже существующие объявы в базе.
Такой подход гарантирует лидерство в поисковых запросах.

   
 
 автор: Loki   (29.06.2005 в 09:46)   письмо автору
 
   для: XPraptor   (29.06.2005 в 02:34)
 

>Такой подход гарантирует лидерство в поисковых запросах.
Я прошу прощенья, а разве html не будет постоянно изменяться? А если постоянно будет, то не будут ли поисковики считать его динамическим?

   
 
 автор: XPraptor   (29.06.2005 в 11:16)   письмо автору
 
   для: Loki   (29.06.2005 в 09:46)
 

Нет, html раз и навсегда. Меняется только динамический контент PHP отображаемый на страницах а html всегда лежит на одном месте и один и тот же.

   
 
 автор: Loki   (29.06.2005 в 12:47)   письмо автору
 
   для: XPraptor   (29.06.2005 в 11:16)
 

Я про это и говорил: неужели поисковики никак не реагируют на частую смену контента в html файле? Если нет, то проще настроить сервер чтобы он умел выполнять php скрипты в html файле. И все бы именно так и делали. Мне кажется все не так просто...

   
 
 автор: XPraptor   (29.06.2005 в 13:50)   письмо автору
 
   для: Loki   (29.06.2005 в 12:47)
 

Нет, вы не правильно меня поняли. Не в html страницах меняется контент, а в активном разделе сайта. А однажды сгенеренный html файл лежит без изменений раз и навсегда пока не удалишь его и на него есть ссылки с активного PHP содержимого и сами страницы регистрируются в поисковиках. Поисковик приведет человека именно на этот файл html а в этом файле ссылки на активные php страницы вашего сайта.

   
 
 автор: Loki   (29.06.2005 в 14:12)   письмо автору
 
   для: XPraptor   (29.06.2005 в 13:50)
 

Еще раз уточню: имеются ввиду страницы со статичным содержанием? (Типа "О компании", "Наши координаты" и пр) А динамические страницы (форум, гостевая и пр) так и остаются на php?
Мне кажется что в данном случае, выигрыш будет не слишком большой, так как наиболее динамичное и релевантное содержимое как раз и будет в новостях, форуме, вопросах и ответах...

   
 
 автор: XPraptor   (29.06.2005 в 16:24)   письмо автору
 
   для: Loki   (29.06.2005 в 14:12)
 

Еще раз уточняю - нет! именно форум, гостевая в html сохраняются, а с динамического форума на php на эти статические ведут ссылки.

   
 
 автор: Loki   (29.06.2005 в 16:39)   письмо автору
 
   для: XPraptor   (29.06.2005 в 16:24)
 

То есть при добавлении поста в тему, страница с темой пересохраняется в html. Так?
То есть поисковик, каждый раз заходя будет обнаруживать изменившееся содержиние.
Тогда есть вопросы:
Что мешает поисковику считать данную страницу динамечески формируемой?
Чем этот способ лучше способа когда php обрабатывается прямо в html файлах?

   
 
 автор: XPraptor   (29.06.2005 в 18:23)   письмо автору
 
   для: Loki   (29.06.2005 в 16:39)
 

Не, наверное из меня плохой объясняльщик :-)
Нет динамики! Тема сохраняется в html и все! Динамическое содержимое на форуме php больше не имеет никакого отношения к сохраненному html файлу. Другая тема сохраняется в другом файле. Тема, рано или поздно закроется, а те ответы что добавлены, они с этого адреса никда не исчезнут. Как был текст "Ваня любит Таню" по адресу http://forum.ru/vanya.html так он там всегда и будет, просто иногда добавляться будет еще текст.

   
 
 автор: Loki   (29.06.2005 в 20:08)   письмо автору
 
   для: XPraptor   (29.06.2005 в 18:23)
 

Позвольте, но ведь и эта тема всегда будет доступна по адресу: http://www.softtime.ru/forum/answer.php?id_forum=1&id_theme=5034&id_post=29402 и отвечать все тем требованиям, которые вы перечислили. Именно поэтому я вас и не понимаю и все ищу подвох:)

   
 
 автор: XPraptor   (30.06.2005 в 13:26)   письмо автору
 
   для: Loki   (29.06.2005 в 20:08)
 

На этом форуме да, потому как темы нумерные и сортируются по правильному. Но есть и другие способы форумов. А вот адрес страницы с темами форума всегда имеет постоянный адрес а контент разный.

   
 
 автор: Loki   (30.06.2005 в 14:02)   письмо автору
 
   для: XPraptor   (30.06.2005 в 13:26)
 

Тогда еще раз разъясните мне пожалуйста. Желательно с примерами "неправильных" форумов и показать как ваш способ помогает эту неправильность обойти.
Можно и на примере главной страницы этого форума.

   
 
 автор: XPraptor   (01.07.2005 в 10:27)   письмо автору
 
   для: Loki   (30.06.2005 в 14:02)
 

Адрес главной страницы этого форума - http://www.softtime.ru/forum/index.php?id_forum=1
В поиске например человек ищет текст PHP сессии и робот находит ему этот текст и ссылает на главную страницу, потому что он проиндексировал здесь этот текст. Человек переходит по ссылке и ничего не находит по сессиям, потому что эта тема уже на 10-й странице с другим адресом.
То же происходит и для тем, если они смещаются по стеку, а не присваиваются раз и навсегда одному адресу.

   
 
 автор: Евгений Петров   (29.06.2005 в 12:17)   письмо автору
 
   для: DJ Paltus   (27.06.2005 в 13:41)
 

А поисковики регистрируются на сайтах, т.е. если для того чтобы зайти на сраницу X нужно ввести логин и пароль, поисковик проиндексирует эту сраницу?

   
 
 автор: cheops   (29.06.2005 в 12:32)   письмо автору
 
   для: Евгений Петров   (29.06.2005 в 12:17)
 

Нет, если страница требует авторизации вы наверное и не хотите, чтобы на неё можно было попасть из поисковиков минуя авторизацию?

   
 
 автор: Евгений Петров   (29.06.2005 в 12:52)   письмо автору
 
   для: cheops   (29.06.2005 в 12:32)
 

А когда поисковик заходит на сайт счетчик посещений регистрирует это?

   
 
 автор: cheops   (29.06.2005 в 12:56)   письмо автору
 
   для: Евгений Петров   (29.06.2005 в 12:52)
 

Тот, у которого движок на JavaScript нет, тот у которого на PHP - регистрирует.

   
 
 автор: Евгений Петров   (29.06.2005 в 12:58)   письмо автору
 
   для: cheops   (29.06.2005 в 12:56)
 

Движок чего? Сайта или поисковика!?

   
 
 автор: cheops   (29.06.2005 в 13:07)   письмо автору
 
   для: Евгений Петров   (29.06.2005 в 12:58)
 

Счётчика. Т.е. PowerCounter зафиксирует посещение робота, а вот счётчики вроде тех, что указаны в низу страницы - уже нет.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования