Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Статистика и боты.
 
 автор: venzh   (24.11.2006 в 09:38)   письмо автору
 
 

Здравствуйте. Нет. Вы не подумайте. Я абсолютный не профессионал в этой области. Но!
Не найдя полноценного ответа на свои вопросы ни в форуме и ни в и-нете, ПРЕДЛАГАЮ профи и асам поработать пальчиками и толковую статью. Так чтобы любой пришёл и в 2 счёта всё понял.
Не спорю, по и-нету искал не особо ретиво… кидайте тогда в меня ссылками,
но лучше ответьте здесь.

1. Что такое количество загрузок – хитов мне прекрасно ясно. А вот хосты? Уникальные пользователи? Но как их определить? По юзвер адженту и ip? Так ip меняется…..Заставить всех регистрироваться? Тоже не выход. Вижу выход в установке каждому юзверю уникальной куки….Но как на самом деле обычно делается?

2. Ip. Просёк на форуме что его можно определить не проксяшный, а «настоящий»? Так это? И как это сделать и какой алгоритм? Как определить, что юзарь сидит за проксёй?


3. Теперь о ботах. Здесь много разговоров об этой нежити, но…. Толкового ответа я не получил что это.
Нет, ну я догадываюсь что «ботинки» бывают хорошие и плохие. Работают как брайзеры или телнеты и на адрес:порт хорошие (а это поисковики) отправляют запросы и скачивают сайт в хэш, а плохие – спам боты настолько хитрожопомудрые что научились находить формы, обрабатывающий скрипт и слать туда хрень всякую, при чем настолько они умные что обходят и регистрацию (е-мэйл) и антипост картинки…..
Правильные догадки?
Но вот вопрос – как на 90% отличить ботинков от юзерей?
Только по юзарь адженту, который можно подделать?
Где взять базу или каким алгоритмом определить что поисковики?
Желательно привести код….


4. Теперь немного в сторону. О поисковиках. Цель и возможное состояние моего проекта предполагает, что 90% моих страниц будет под паролем. А раскручиваться в поисковиках охота….
Как поступить? В тайне по юзарь адженту дать доступ поисковикам?

5. А реферер может быть пустым?

   
 
 автор: cheops   (24.11.2006 в 12:11)   письмо автору
 
   для: venzh   (24.11.2006 в 09:38)
 

>А вот хосты?
Хосты - это количество уникальных IP-адресов, с которых было произведено обращение к ресурсу.
>Уникальные пользователи?
Это реальные пользователи, каждый из пользователей может выходить из под нескольких IP-адресов, а из под одного IP-адреса может выходить несколько пользователей. Оценка здесь часто приближённая. Всё правильно обычно ставят уникальную cookie и проверяют имется ли у пользователя cookie или нет.

>2. Ip. Просёк на форуме что его можно определить не проксяшный, а «настоящий»? Так это? И
>как это сделать и какой алгоритм? Как определить, что юзарь сидит за проксёй?
IP-адрес клиента, обращающегося к серверу помещается в $_SERVER['REMOTE_ADDR'], однако при использовании промежуточного прокси-сервера в качестве непосредственного клиента выступает прокси-сервер, и IP-адрес исходного клиента не доступен. Ряд прокси-серверов (не все) устанавливают переменную HTTP_X_FORWARDED_FOR, в которую помещают IP-адрес клиента. Получить её можно при помощи функции getenv()
<?php
  $forward 
getenv(HTTP_X_FORWARDED_FOR);
?>


>3. Правильные догадки?
Да.
>Но вот вопрос – как на 90% отличить ботинков от юзерей?
Хороший бот не маскируется - у него прозрачный USER_AGENT ($_SERVER['HTTP_USER_AGENT']), где чёрным по белому написано, что это за бот, иногда даже URL, где о нём можно почитать. Плохой бот вычислить нельзя, протокол HTTP не ограничивает клиентов в человечности, хотите через браузер загружайте информацию, хотите через интелектуальный агент (бот), сообщать о себе можете всё что угодно, что вы поисковый робот яндекса, Internet Explorer, инопланетянен...
Поисковые роботы определяются примерно так
<?php
      
if(strpos($_SERVER['HTTP_USER_AGENT'], "StackRambler") !== false$os 'robot_rambler';
      if(
strpos($_SERVER['HTTP_USER_AGENT'], "Googlebot")    !== false$os 'robot_google';
      if(
strpos($_SERVER['HTTP_USER_AGENT'], "Mediapartners-Google")    !== false$os 'robot_google';
      if(
strpos($_SERVER['HTTP_USER_AGENT'], "Yandex")       !== false$os 'robot_yandex';
      if(
strpos($_SERVER['HTTP_USER_AGENT'], "Aport")        !== false$os 'robot_aport';
      if(
strpos($_SERVER['HTTP_USER_AGENT'], "msnbot")       !== false$os 'robot_msnbot';
?>

Здесь вы можете ориентироваться на счётчик PowerCounter.

>4. В тайне по юзарь адженту дать доступ поисковикам?
Пользователи на ваш сайт будут попадать через поисковики, поэтому они будут прекрасно видеть как защищены их данные. Подсовывать роботам одну страницу, а пользователям другу, тоже не рекомендуется - у поисковых систем имеются роботы проверяющие и если они заметят разницу - вы отправитесь в бан, про раскрутку в этом случае можно забыть.

>5. А реферер может быть пустым?
Да. В большинстве случаев он пуст, некоторые браузеры вообще позволяют запретить установку реферера.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования