|
|
|
| Я прочитал книгу И. Ашманова А. Иванова "Продвижение сайта в поисковых системах". В частности в этой книге говорится: "Поисковые роботы не исполняют скриптов на страницах..." и далее рассматриваются некоторые технические аспекты, из-за которых поисковые машины хуже индексируют страницы или вообще этого не делают. Сейчас читаю книжку "Практика программирования Web-сайта". Если я всё правильно понимаю, то все статьи, которые создаются через админку, храняться в базе данных на сервере. Получается, что поисковому роботу нужно выполнить скрипт, чтобы получить эту статью из базы данных. Правильно? Если так, то сайт, созданный на PHP по этой книге, будет хуже индексироваться, чем если бы я сделал сайт при помощи старого доброго html.
Я правильно понимаю или у меня не хватает какой-то информации? | |
|
|
|
|
|
|
|
для: ildarufa
(30.01.2007 в 15:29)
| | если запрос к базе и ответ занивают много времени, то поисковик может плюнуть, а так разницы между html и php нет - на выходе они одинаковы. а не испольняются скрипты javascript | |
|
|
|
|
|
|
|
для: AlexSol
(30.01.2007 в 15:44)
| | То есть поисковик в любом случае обращается к базе данных, если на странице написано, что нужно обратиться к базе данных или как? | |
|
|
|
|
|
|
|
для: ildarufa
(30.01.2007 в 15:48)
| | поисковик идет по ссылке на указанную вами страницу - если в коде php есть обращение к базе, то оно будет исполнено. | |
|
|
|
|
|
|
|
для: ildarufa
(30.01.2007 в 15:29)
| | Не хватает. В обоих книгах все верно. В первой имелось ввиду, что JavaScript роботами не просматривается и не учитывается. Поэтому, если строить сайт на JS, то на хорошую индексируемость лучше не рассчитывать.
А PHP - серверный скрипт. Он генерирует страницу, а только потом дает ее роботу, браузеру или кому еще, кто попросил. Дело в том, что робот поисковый - это обычный клиент и ничем не отличается от человека для сервера. (отличается, но это мелочи).
Что касается индексируемости, то давно известно, что обычные html странички (не сгенерированные на стороне сервера) индексируются лучше. Почему? Все просто: роботы смотрят на url. Если он вида http://site.ru/index.php?id=3&dir=wer, то робот поставит такую страницу ниже (но это не подтвержденные данные, лично я разницы не замечаю). В принципе, это логично. Потому что страница с таким адресом явно динамичная, а значит, когда человек зайдет по этой ссылке с поисковой системы, он может увидеть уже совсем другую инфу.
Короче: не выводите конент JavaScript-ом, потому что этот контент робот не увидит. На сервере можете писать сколько угодно. | |
|
|
|
|
|
|
|
для: SHAman
(30.01.2007 в 15:47)
| | Полный текст там звучит так: "Поисковые роботы не исполняют скриптов на страницах, поэтому для робота ссылка на http://top.mail.ru/jump?to=324543&url=http://russianamerica.com выглядит как ссылка на сайт top.mail.ru, а не на http://russianamerica.com."
Из чего я сделал вывод, что какие-то страницы поисковый робот вообще может не запросить. | |
|
|
|
|
|
|
|
для: ildarufa
(30.01.2007 в 15:51)
| | Не, ему по-барабану по каким ссылкам ходить. Ведь он просто шлет запрос серверу и ждет ответа. Ответ - это текст с техническим заголовком. Этот текст робот анализирует и сохраняет полученные данные. Все. Технология простая. (на словах) | |
|
|
|
|
|
|
|
для: SHAman
(30.01.2007 в 16:00)
| | Насколько я могу понять твою логику, ты прав, но отчасти. То есть если у робота есть такая ссылка и она не создана динамически, то ему не надо исполнять никаких скриптов в этом случае он может запросить эту страницу. Если ссылка создаётся динамически, то, как я понимаю, посиковик не запросит страницу, если исходит из того, что написано в этой книге.
А вот что касается обращения к базе данных. Про JS понятно. Насколько я понял работу роботов, они запрашивают страницу, убирают всякие тэги и оставляют слова и их индексируют. В случае со странице с PHP, ситуация отличается - поисковик запрашивает страницу, а в коде написано, что нужно соединиться с базой данных и получить текст, на самой странице текста нет (я имею в виду в коде страницы нет самого текста, его нужно взять из базы). Если робот не исполняет скрипта, то он не получит этого текста. | |
|
|
|
|
|
|
|
для: ildarufa
(30.01.2007 в 16:13)
| | Ты не понимаешь как работает web. Все происходит так: страница с кодом PHP лежит на СЕРВЕРЕ. Когда к ней обращаются, то сервер берет ее, смотрит что он взял, если это код, то дает ему все параметры, которые тот попросит, выполняет его. И только РЕЗУЛЬТАТ отдает обратно тому, кто запросил эту страницу. Т.е. робот получит ту же самую страницу.
Что касается динамического формирования ссылок. Это истинно, если только ссылка формируется JS. Если ее в коде html нет, то ее робот не увидит. Если есть, то увидит. Даже если эта ссылка была создана сервером динамически.
Правило: все, что делается на сервере робот не увидит, не узнает и вообще никак его это не трогает. Его трогает только то, что на клиенте.
Кстати, роботы не убирают все теги. Они их тоже анализируют. И стили, на сколько я понял, тоже. Потому что ссылки, убранные display: none; не индексируются, хотя они в коде есть. | |
|
|
|
|
|
|
|
для: ildarufa
(30.01.2007 в 16:13)
| | вы не понимаете принцир работы php.
1)php можно заставить работать и в файлах html - так что расширение ничего ни о чем не говорит
2)php исполняется на сервере. поисковик, как и обычный пользователь видит тольк результат работы. он физически не может понять есть ли обращение к базе или нет | |
|
|
|
|
|
|
|
для: AlexSol
(30.01.2007 в 16:24)
| | Ладно, вы меня успокоили. Значит проиндексирует текст, как мне надо.
Насчёт "Кстати, роботы не убирают все теги. Они их тоже анализируют", то в книге написано вот что: "...индексный робот перебирает все выкаченные страницы, нумерует их..." "...удаляет из текста страниц всякий ненужный, нетекстовой "мусор" (например, разметку языка HTML), затем извлекает из текста слова и помещает их в индекс".
Но, видимо, поисковик как-то всё-таки анализирует теги, потому что в той же книге даются советы о том, как оптимизировать страницу, используя их. | |
|
|
|