Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: PowerCounter 2.2
 
 автор: cheops   (26.03.2005 в 15:34)   письмо автору
 
 

Представляем вашему вниманию новую версию системы сбора и анализа статистики по посещаемости сайта PowerCounter 2.2. В новой версии, по совету Loki http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=2274 добавлен учёт ключевых слов, вводимых посетителем в поисковых системах Mail.ru и MSN.

Внимание!
Если вы производите обновление версии с 2.1 до 2.2 следует выполнить SQL-запрос в файле update.sql - который модифицирует базу данных. Содержимое этого файла
ALTER TABLE refferer MODIFY searches enum('none', 'yandex', 'google', 'rambler', 'aport', 'own_site', 'mail', 'msn');
ALTER TABLE ip MODIFY searches enum('none', 'yandex', 'google', 'rambler', 'aport', 'own_site', 'mail', 'msn');


http://www.softtime.ru/info/powercounter20.php

   
 
 автор: Loki   (27.03.2005 в 20:22)   письмо автору
 
   для: cheops   (26.03.2005 в 15:34)
 

Из того что наковырял:
В файле searchquery.php в разделе case 'total' учитываются по прежнему только 4 поисковика.
А в работе пока не проверял:)))

   
 
 автор: cheops   (27.03.2005 в 22:20)   письмо автору
 
   для: Loki   (27.03.2005 в 20:22)
 

Ага... есть такое дело - выложу сегодня версию 2.2.1 с исправлением этой ошибки.

   
 
 автор: Ziq   (28.03.2005 в 08:44)   письмо автору
 
   для: cheops   (27.03.2005 в 22:20)
 

Cheops, извини, что не стал создавать новую тему но что означает вот этот запрос. Ничего подобного я пока не встречал (первую книгу дочит, а вторую начал).

ALTER TABLE ip MODIFY searches enum('none', 'yandex', 'google', 'rambler', 'aport', 'own_site', 'mail', 'msn');

   
 
 автор: Loki   (28.03.2005 в 09:01)   письмо автору
 
   для: Ziq   (28.03.2005 в 08:44)
 

Это команда базе данных на изменение структуры таблицы. В частности эта команда коговорит что в таблице ip поле searches типа enum может принимать одно из значений указанных в скобках.

   
 
 автор: cheops   (28.03.2005 в 09:30)   письмо автору
 
   для: Ziq   (28.03.2005 в 08:44)
 

Да, Loki правильно говорит, дело в том, что раньше в поле searches было только 5 значений
'none', 'yandex', 'google', 'rambler', 'aport', 'own_site'

Теперь в него необходимо добавить ещё два - для этого необходимо изменить структуру таблиц - это осуществляется при помощи оператора ALTER.

   
 
 автор: Loki   (28.03.2005 в 09:02)   письмо автору
 
   для: cheops   (27.03.2005 в 22:20)
 

Я ожидал что и в поисковые роботы добавятся изменения... во всяком случае, поисковый робот msn уже известен...

   
 
 автор: cheops   (28.03.2005 в 09:31)   письмо автору
 
   для: Loki   (28.03.2005 в 09:02)
 

Робота добавим чуть позже...

   
 
 автор: Loki   (28.03.2005 в 10:03)   письмо автору
 
   для: cheops   (28.03.2005 в 09:31)
 

Быть может, стоит сделать это аналогично сылкам? чтобы пользователь мог сам добавлять интересующие его поисковики.

   
 
 автор: cheops   (28.03.2005 в 10:10)   письмо автору
 
   для: Loki   (28.03.2005 в 10:03)
 

Хм... в принципе это можно, но в скорости потеряем - сейчас роботы жёстко прошиты в базе, USER_AGENT не хранится, а храниться только одно число, соответствующее роботу... А для того, чтобы можно было самостоятельно добавлять робота потребуется хранить все USER_AGENT и осуществлять по ним поиск - в ранних версиях PowerCounter так было - это достаточно медленно.

   
 
 автор: Loki   (28.03.2005 в 12:21)   письмо автору
 
   для: cheops   (28.03.2005 в 10:10)
 

Ну в поисковых запросах этот механизм все равно уже реализован, так что то, что выиграли на поисковиках, уже проиграно на поисковых запросах.
А если поступить так: чтобы поле searches было булевского типа, и полнотекстовый поиск производился только в полях, где searches=true?

   
 
 автор: cheops   (28.03.2005 в 22:25)   письмо автору
 
   для: Loki   (28.03.2005 в 12:21)
 

Ну ключевые слова хранить всё равно необходимо - они каждый раз разные, а USER_AGENT повторяется - обидно хранить одно и тоже... У нас миллион записей набегает за 3 месяца и такого поведения счётчика хотелось бы избежать. А при сохранении referera хранятся только те, которые не являются переходами с сайта для которого собирается статитстика. Хотя наверное следует подумать в этом направлении, возможно можно выправить ситуациию нормализацией, т.е. вводом ещё одной таблицы под роботов...

   
 
 автор: Loki   (29.03.2005 в 12:59)   письмо автору
 
   для: cheops   (28.03.2005 в 22:25)
 

Идея замечательная!
Только как в этом случае пользователю отлавливать поисковых роботов? Ведь USER AGENT сохраняться в этом случае не будет. Можно, конечно, заложить всю статистику собранную в соседней ветке и отображать новые поисковики по мере их появления в статистике.

   
 
 автор: cheops   (29.03.2005 в 22:30)   письмо автору
 
   для: Loki   (29.03.2005 в 12:59)
 

Наверное здесь лучше отдельную ловушку держать... так как автоматически их отловить вряд ли получится - их названия регулярно меняются...
Жаль, что не существует единой базы данных по поисковым роботам (вроде whois), где бы они могли зарегистрировать свои поисковые роботы, а владельцам сайтов не приходилось бы ломать голову о том, что это за робот и каковы его цели - достаточно было бы проверить его по этой базе данных...

   
 
 автор: Loki   (28.03.2005 в 10:09)   письмо автору
 
   для: cheops   (27.03.2005 в 22:20)
 

Еще не внесены изменения в файлы searchhours.php searchdays.php и не внесены изменения в функцию search_hour в файле utils.php

   
 
 автор: cheops   (28.03.2005 в 10:16)   письмо автору
 
   для: Loki   (28.03.2005 в 10:09)
 

Ага, спасибо.

   
 
 автор: denvor   (28.03.2005 в 16:58)   письмо автору
 
   для: cheops   (28.03.2005 в 10:16)
 

'

   
 
 автор: denvor   (28.03.2005 в 17:01)   письмо автору
 
   для: cheops   (28.03.2005 в 10:16)
 

'а где-то пробегало предложение отсылку статистики за день скидывать по мылу - пока не сделали?

   
 
 автор: Akira   (28.03.2005 в 17:22)   письмо автору
 
   для: denvor   (28.03.2005 в 17:01)
 

Хоть убейте ну не могу скачать =( Чистый лист. Может это из-за Opera?

   
 
 автор: cheops   (28.03.2005 в 22:26)   письмо автору
 
   для: Akira   (28.03.2005 в 17:22)
 

Хм... проверил Opera - качается, попробуйте загрузить файл по прямой ссылке http://www.softtime.ru/files/powercounter22.zip

   
 
 автор: Akira   (28.03.2005 в 22:38)   письмо автору
 
   для: cheops   (28.03.2005 в 22:26)
 

Что бы мое голову =/ Надо выключать прокси =((

   
 
 автор: Akira   (28.03.2005 в 23:16)   письмо автору
 
   для: Akira   (28.03.2005 в 22:38)
 

Кстати , а почему вы не итегрируете его в форум?

   
 
 автор: cheops   (28.03.2005 в 22:27)   письмо автору
 
   для: denvor   (28.03.2005 в 17:01)
 

Да, это стоит в плане, но скорее всего будет реализовано уже в третьей версии счётчика.

   
 
 автор: Loki   (29.03.2005 в 13:08)   письмо автору
 
   для: cheops   (26.03.2005 в 15:34)
 

Какие переделки внес я:
страницы учитываются не по адресу страницы, а по ее названию (сразу исчезли глюки с адресами типа "test/", "test/index.php", "test/index.php?id=0" ведущими на одну и ту же страницу, а так же адресами несуществующих страниц). Так же повысилась читаемость и информативность статистики.
Добавил отчет, где показывается сколько конкретный посетитель просмотрел страниц, каких именно и в какой последовательности. Очень познавательно - рекомендую всем!
Добавил поисковик MSN к поисковым роботам (думаю, в официальной версии это тоже скоро появится).
В таблице реффереров добавил строчку "итого" - всегда можно сравнить сколько посетителей пришли к вам по ссылкам, а сколько по закладкам. Новые реффереры, не внесенные в таблицу, появляются в дополнительной таблице внизу - вы всегда знаете где появилась новая ссылка на ваш ресурс.
В поисковых запросах при клике на ip происходит переход на статистику просмотров страниц этим посетителем. Мне показалось что это удобно.
Ну и кой какие косяки, которые уже обсуждались в форуме и испаравляются авторами по мере их обнаружения.
Если авторы сочтут необходимым, они реализуют подобные функции в следующих релизах, если не сочтут - спрашивайте, поделюсь своими:)

   
 
 автор: denvor   (29.03.2005 в 17:02)   письмо автору
 
   для: Loki   (29.03.2005 в 13:08)
 

2Loki:
спрашиваем, поделитесь - уж очень вкусно звучит!

   
 
 автор: Loki   (29.03.2005 в 17:21)   письмо автору
 
   для: denvor   (29.03.2005 в 17:02)
 

Структура таблиц в базе данных выглядит следующим образом:

CREATE TABLE 'pages' (
  'id_page' int(10) NOT NULL auto_increment,
  'name' text,
  'title' text NOT NULL,
  'id_site' int(4) default NULL,
  PRIMARY KEY  ('id_page')
) TYPE=MyISAM 



CREATE TABLE 'pages' (
  'id_page' int(10) NOT NULL auto_increment,
  'name' text,
  'title' text NOT NULL,
  'id_site' int(4) default NULL,
  PRIMARY KEY  ('id_page')
) TYPE=MyISAM 


В файле count.php внесены незначительные изменения но, чтобы что-то не забыть где именно, выкладываю его целиком.
Обратите внимание, что в таблице pages появилась новая колонка - туда заносятся названия страниц из переменной $titlepage, которая должна быть прописана в ваших файлах!
Если страницы имеют одинаковое название, то они будут посчитаны как одна страница.

   
 
 автор: Loki   (29.03.2005 в 17:24)   письмо автору
 
   для: denvor   (29.03.2005 в 17:02)
 

тут остальные измененные файлы. Если что забыл - свистните и я выложу.

Забыл сказать - я еще не вносил новые поисковые системы, которые внес в официальную версию cheops.

   
 
 автор: cheops   (29.03.2005 в 22:36)   письмо автору
 
   для: Loki   (29.03.2005 в 17:24)
 

А не могли бы вы сообщить свое ФИО и e-mail, чтобы мы добавили их в шапку соответствующих файлов, как того требует BSD-подобная лицензия, я в ближайшее время постараюсь интегрировать все эти изменения... Хм... правда названия страниц боюсь добавлять, что делать, если имеется несколько страниц с одинаковыми названиями, но различным содержимым? Или это не очень критично?

   
 
 автор: Loki   (30.03.2005 в 09:25)   письмо автору
 
   для: cheops   (29.03.2005 в 22:36)
 

Левин А.В.
loki_angel@mail.ru
Я сам долго размышлял над этим вопросом. В итоге пришел к выводу, что названия страниц - как оглавление в книге, то есть двух одинаковых быть не должно. Адреса страниц - не вполне корректное для анализа поле:
например, в соседней теме вы подсказали как сделать чтобы ссылки вида /site/index.php и /site/ обрабатывались как одна, но например у меня на сайте в различных разделах есть конструкции вида /site/index.php?gl=0&id=0 /site/index.php?id=0 ваша гостевая опять же /guest/index.php?start=0.
Кроме того, люди по прежнему приходят из поисковиков на мертвые ссылки вида index.php?id=something и все это учитывается как отдельные страницы.
Все возможные случаи навигации в счетчике не предусмотреть.
Для ретроградов можно добавить в index.php дополнительную проверку: чтобы и адрес страницы и ее название совпадали.

Так и знал что что-нибудь забуду:) Прикладываю файл index.php

   
 
 автор: cheops   (30.03.2005 в 10:10)   письмо автору
 
   для: Loki   (30.03.2005 в 09:25)
 

Вообще то вы правы, если название отсутствует, то можно помещать вместо него URL - тогда можно будет помещать названия страниц или действовать по старому.

   
 
 автор: denvor   (30.03.2005 в 15:49)   письмо автору
 
   для: cheops   (30.03.2005 в 10:10)
 

Те вскоре можно ожидать версию 2.3 с добавлениями Loki и ловушкой роботов? :)

   
 
 автор: Loki   (30.03.2005 в 19:16)   письмо автору
 
   для: denvor   (30.03.2005 в 15:49)
 

Ну ловушка для роботов занимает всего 2 строчки - в файле index.php на два поста выше последние две строки - она и есть:)

   
 
 автор: cheops   (30.03.2005 в 22:40)   письмо автору
 
   для: denvor   (30.03.2005 в 15:49)
 

Нет ловушки в PowerCounter мы помещать скорее всего не будем, так как информация не для конечного пользователя, а для разработчиков - её лучше отдельно поставить, как это описывается в этой теме.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования