|
|
|
| Здравствуйте. Нет. Вы не подумайте. Я абсолютный не профессионал в этой области. Но!
Не найдя полноценного ответа на свои вопросы ни в форуме и ни в и-нете, ПРЕДЛАГАЮ профи и асам поработать пальчиками и толковую статью. Так чтобы любой пришёл и в 2 счёта всё понял.
Не спорю, по и-нету искал не особо ретиво… кидайте тогда в меня ссылками,
но лучше ответьте здесь.
1. Что такое количество загрузок – хитов мне прекрасно ясно. А вот хосты? Уникальные пользователи? Но как их определить? По юзвер адженту и ip? Так ip меняется…..Заставить всех регистрироваться? Тоже не выход. Вижу выход в установке каждому юзверю уникальной куки….Но как на самом деле обычно делается?
2. Ip. Просёк на форуме что его можно определить не проксяшный, а «настоящий»? Так это? И как это сделать и какой алгоритм? Как определить, что юзарь сидит за проксёй?
3. Теперь о ботах. Здесь много разговоров об этой нежити, но…. Толкового ответа я не получил что это.
Нет, ну я догадываюсь что «ботинки» бывают хорошие и плохие. Работают как брайзеры или телнеты и на адрес:порт хорошие (а это поисковики) отправляют запросы и скачивают сайт в хэш, а плохие – спам боты настолько хитрожопомудрые что научились находить формы, обрабатывающий скрипт и слать туда хрень всякую, при чем настолько они умные что обходят и регистрацию (е-мэйл) и антипост картинки…..
Правильные догадки?
Но вот вопрос – как на 90% отличить ботинков от юзерей?
Только по юзарь адженту, который можно подделать?
Где взять базу или каким алгоритмом определить что поисковики?
Желательно привести код….
4. Теперь немного в сторону. О поисковиках. Цель и возможное состояние моего проекта предполагает, что 90% моих страниц будет под паролем. А раскручиваться в поисковиках охота….
Как поступить? В тайне по юзарь адженту дать доступ поисковикам?
5. А реферер может быть пустым? | |
|
|
|
|
|
|
|
для: venzh
(24.11.2006 в 09:38)
| | >А вот хосты?
Хосты - это количество уникальных IP-адресов, с которых было произведено обращение к ресурсу.
>Уникальные пользователи?
Это реальные пользователи, каждый из пользователей может выходить из под нескольких IP-адресов, а из под одного IP-адреса может выходить несколько пользователей. Оценка здесь часто приближённая. Всё правильно обычно ставят уникальную cookie и проверяют имется ли у пользователя cookie или нет.
>2. Ip. Просёк на форуме что его можно определить не проксяшный, а «настоящий»? Так это? И
>как это сделать и какой алгоритм? Как определить, что юзарь сидит за проксёй?
IP-адрес клиента, обращающегося к серверу помещается в $_SERVER['REMOTE_ADDR'], однако при использовании промежуточного прокси-сервера в качестве непосредственного клиента выступает прокси-сервер, и IP-адрес исходного клиента не доступен. Ряд прокси-серверов (не все) устанавливают переменную HTTP_X_FORWARDED_FOR, в которую помещают IP-адрес клиента. Получить её можно при помощи функции getenv()
<?php
$forward = getenv(HTTP_X_FORWARDED_FOR);
?>
|
>3. Правильные догадки?
Да.
>Но вот вопрос – как на 90% отличить ботинков от юзерей?
Хороший бот не маскируется - у него прозрачный USER_AGENT ($_SERVER['HTTP_USER_AGENT']), где чёрным по белому написано, что это за бот, иногда даже URL, где о нём можно почитать. Плохой бот вычислить нельзя, протокол HTTP не ограничивает клиентов в человечности, хотите через браузер загружайте информацию, хотите через интелектуальный агент (бот), сообщать о себе можете всё что угодно, что вы поисковый робот яндекса, Internet Explorer, инопланетянен...
Поисковые роботы определяются примерно так
<?php
if(strpos($_SERVER['HTTP_USER_AGENT'], "StackRambler") !== false) $os = 'robot_rambler';
if(strpos($_SERVER['HTTP_USER_AGENT'], "Googlebot") !== false) $os = 'robot_google';
if(strpos($_SERVER['HTTP_USER_AGENT'], "Mediapartners-Google") !== false) $os = 'robot_google';
if(strpos($_SERVER['HTTP_USER_AGENT'], "Yandex") !== false) $os = 'robot_yandex';
if(strpos($_SERVER['HTTP_USER_AGENT'], "Aport") !== false) $os = 'robot_aport';
if(strpos($_SERVER['HTTP_USER_AGENT'], "msnbot") !== false) $os = 'robot_msnbot';
?>
|
Здесь вы можете ориентироваться на счётчик PowerCounter.
>4. В тайне по юзарь адженту дать доступ поисковикам?
Пользователи на ваш сайт будут попадать через поисковики, поэтому они будут прекрасно видеть как защищены их данные. Подсовывать роботам одну страницу, а пользователям другу, тоже не рекомендуется - у поисковых систем имеются роботы проверяющие и если они заметят разницу - вы отправитесь в бан, про раскрутку в этом случае можно забыть.
>5. А реферер может быть пустым?
Да. В большинстве случаев он пуст, некоторые браузеры вообще позволяют запретить установку реферера. | |
|
|
|