|
|
|
| Добрый день!
Я вот не могу понять, как поисковые системы (Rambler, Yandex и т.д.) индексируют страницы сайта, в основе которого лежат таблицы базы данных.
Ведь страница "собирается" из разных кусочков в прцессе просмотра ее пользователем.
А так приходит робот и видит набор файлов с кодом PHP и запросами MySQL.
Как он выбирает META-данные и т.д., неужели выполняет SQL запросы и "собирает" для себя готовые страницы, а потом их индексирует? | |
|
|
|
|
|
|
|
для: Boris
(27.06.2005 в 13:31)
| | На самом деле, роботы поисковых систем не копаются в PHP-коде, им его никто не предоставляет - они видят то, что видят обычные посетители - цельную HTML-страницу. | |
|
|
|
|
|
|
|
для: cheops
(27.06.2005 в 13:36)
| | А как они видят HTML-страницу если ее нет на сервере, откуда она появляется? | |
|
|
|
|
|
|
|
для: Boris
(27.06.2005 в 13:39)
| | Бот - тот же человек, для сервера. Он приходит, браузит страницу, а потом анализирует выданный ему ХТМЛ-код. Обращается к сайту как простой смертный. | |
|
|
|
|
|
|
|
для: DJ Paltus
(27.06.2005 в 13:41)
| | Ага, понял!
Спасибо! А то я начал было беспокоится :) | |
|
|
|
|
|
|
|
для: Boris
(27.06.2005 в 13:44)
| | Правильно начал! Если у тебя под одним и тем же адресом генерится каждый раз разный набор данных то поисковики в мануале так и пишут: Зачем индексировать такие страницы, если завтра их уже не будет? Создайте локальную html компию и добавьте ее для индексации. Вона как! | |
|
|
|
|
|
|
|
для: XPraptor
(27.06.2005 в 19:04)
| | Всё-равно индексируют... например главную страницу этого форума индексируют, несмотря на то, что она меняется каждый день. | |
|
|
|
|
|
|
|
для: cheops
(27.06.2005 в 21:08)
| | На счет индексируют - они не могут не индексировать, раз страница есть и на нее есть ссылка.
На моем портале (www.inteerss.ru) все страницы разделов с объявлениями генерятся из базы динамически и ключевые слова автоматом составляются на основе максимального кол-ва слов на текущей странице, и описания тоже автосоздаются, поэтому там в течение дня уже всегда разный контент под одним адресом. И именно это и было моей самой грубой ошибкой, вес таким страницам поисковики дают минимальный, они контенту этих страниц у себя в кэше и то больший вес присваивают, чем обновленной версии страницы.
Такой глупостью я убил себе поисковый трафик напрочь. Теперь переделываю всю структуру портала как у org.torgcenter.ru. Они сразу грамотно забомбили - сразу объява генерится в отдельный html файл который сохраняется на хосте и автоматом заносится в пять основных поисковиков для индексации как новый сайт (или страница сайта). Уже заканчиваю дописание, осталось сгенерить файлы на уже существующие объявы в базе.
Такой подход гарантирует лидерство в поисковых запросах. | |
|
|
|
|
|
|
|
для: XPraptor
(29.06.2005 в 02:34)
| | >Такой подход гарантирует лидерство в поисковых запросах.
Я прошу прощенья, а разве html не будет постоянно изменяться? А если постоянно будет, то не будут ли поисковики считать его динамическим? | |
|
|
|
|
|
|
|
для: Loki
(29.06.2005 в 09:46)
| | Нет, html раз и навсегда. Меняется только динамический контент PHP отображаемый на страницах а html всегда лежит на одном месте и один и тот же. | |
|
|
|
|
|
|
|
для: XPraptor
(29.06.2005 в 11:16)
| | Я про это и говорил: неужели поисковики никак не реагируют на частую смену контента в html файле? Если нет, то проще настроить сервер чтобы он умел выполнять php скрипты в html файле. И все бы именно так и делали. Мне кажется все не так просто... | |
|
|
|
|
|
|
|
для: Loki
(29.06.2005 в 12:47)
| | Нет, вы не правильно меня поняли. Не в html страницах меняется контент, а в активном разделе сайта. А однажды сгенеренный html файл лежит без изменений раз и навсегда пока не удалишь его и на него есть ссылки с активного PHP содержимого и сами страницы регистрируются в поисковиках. Поисковик приведет человека именно на этот файл html а в этом файле ссылки на активные php страницы вашего сайта. | |
|
|
|
|
|
|
|
для: XPraptor
(29.06.2005 в 13:50)
| | Еще раз уточню: имеются ввиду страницы со статичным содержанием? (Типа "О компании", "Наши координаты" и пр) А динамические страницы (форум, гостевая и пр) так и остаются на php?
Мне кажется что в данном случае, выигрыш будет не слишком большой, так как наиболее динамичное и релевантное содержимое как раз и будет в новостях, форуме, вопросах и ответах... | |
|
|
|
|
|
|
|
для: Loki
(29.06.2005 в 14:12)
| | Еще раз уточняю - нет! именно форум, гостевая в html сохраняются, а с динамического форума на php на эти статические ведут ссылки. | |
|
|
|
|
|
|
|
для: XPraptor
(29.06.2005 в 16:24)
| | То есть при добавлении поста в тему, страница с темой пересохраняется в html. Так?
То есть поисковик, каждый раз заходя будет обнаруживать изменившееся содержиние.
Тогда есть вопросы:
Что мешает поисковику считать данную страницу динамечески формируемой?
Чем этот способ лучше способа когда php обрабатывается прямо в html файлах? | |
|
|
|
|
|
|
|
для: Loki
(29.06.2005 в 16:39)
| | Не, наверное из меня плохой объясняльщик :-)
Нет динамики! Тема сохраняется в html и все! Динамическое содержимое на форуме php больше не имеет никакого отношения к сохраненному html файлу. Другая тема сохраняется в другом файле. Тема, рано или поздно закроется, а те ответы что добавлены, они с этого адреса никда не исчезнут. Как был текст "Ваня любит Таню" по адресу http://forum.ru/vanya.html так он там всегда и будет, просто иногда добавляться будет еще текст. | |
|
|
|
|
|
|
|
для: XPraptor
(29.06.2005 в 18:23)
| | Позвольте, но ведь и эта тема всегда будет доступна по адресу: http://www.softtime.ru/forum/answer.php?id_forum=1&id_theme=5034&id_post=29402 и отвечать все тем требованиям, которые вы перечислили. Именно поэтому я вас и не понимаю и все ищу подвох:) | |
|
|
|
|
|
|
|
для: Loki
(29.06.2005 в 20:08)
| | На этом форуме да, потому как темы нумерные и сортируются по правильному. Но есть и другие способы форумов. А вот адрес страницы с темами форума всегда имеет постоянный адрес а контент разный. | |
|
|
|
|
|
|
|
для: XPraptor
(30.06.2005 в 13:26)
| | Тогда еще раз разъясните мне пожалуйста. Желательно с примерами "неправильных" форумов и показать как ваш способ помогает эту неправильность обойти.
Можно и на примере главной страницы этого форума. | |
|
|
|
|
|
|
|
для: Loki
(30.06.2005 в 14:02)
| | Адрес главной страницы этого форума - http://www.softtime.ru/forum/index.php?id_forum=1
В поиске например человек ищет текст PHP сессии и робот находит ему этот текст и ссылает на главную страницу, потому что он проиндексировал здесь этот текст. Человек переходит по ссылке и ничего не находит по сессиям, потому что эта тема уже на 10-й странице с другим адресом.
То же происходит и для тем, если они смещаются по стеку, а не присваиваются раз и навсегда одному адресу. | |
|
|
|
|
|
|
|
для: DJ Paltus
(27.06.2005 в 13:41)
| | А поисковики регистрируются на сайтах, т.е. если для того чтобы зайти на сраницу X нужно ввести логин и пароль, поисковик проиндексирует эту сраницу? | |
|
|
|
|
|
|
|
для: Евгений Петров
(29.06.2005 в 12:17)
| | Нет, если страница требует авторизации вы наверное и не хотите, чтобы на неё можно было попасть из поисковиков минуя авторизацию? | |
|
|
|
|
|
|
|
для: cheops
(29.06.2005 в 12:32)
| | А когда поисковик заходит на сайт счетчик посещений регистрирует это? | |
|
|
|
|
|
|
|
для: Евгений Петров
(29.06.2005 в 12:52)
| | Тот, у которого движок на JavaScript нет, тот у которого на PHP - регистрирует. | |
|
|
|
|
|
|
|
для: cheops
(29.06.2005 в 12:56)
| | Движок чего? Сайта или поисковика!? | |
|
|
|
|
|
|
|
для: Евгений Петров
(29.06.2005 в 12:58)
| | Счётчика. Т.е. PowerCounter зафиксирует посещение робота, а вот счётчики вроде тех, что указаны в низу страницы - уже нет. | |
|
|
|