Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Фильтрация матов и рекламы
 
 автор: Wyfinger   (13.06.2007 в 09:00)   письмо автору
 
 

Такая ситуация: есть что-то вроде гостевой книги, каждый без регистрации может оставить запись. Я бы хотел фильтровать всякую нецензурщину и рекламу.
Есть какие-нибудь системы? т.е. интеллектуальная система распознавания матов и ректамы, чтобы человек проверял только подозрительные (с точки зрения системы) сообщения?

   
 
 автор: cheops   (13.06.2007 в 10:39)   письмо автору
 
   для: Wyfinger   (13.06.2007 в 09:00)
 

Возможно вас заинтересует скрипт по ссылке http://www.softtime.ru/info/matu_net.php.

   
 
 автор: Витос   (13.06.2007 в 18:59)   письмо автору
 
   для: cheops   (13.06.2007 в 10:39)
 

Возможно вас заинтересует скрипт по ссылке http://www.softtime.ru/info/matu_net.php.
Плохой скрипт... Он в словах ищет буквы и из них же маты составляет.. Это же смешно..

Автор, читай тему
http://softtime.ru/forum/read.php?id_forum=1&id_theme=38612
Там смс-сенда примерыф пробуй...

   
 
 автор: kasmanaft   (13.06.2007 в 19:46)   письмо автору
 
   для: Витос   (13.06.2007 в 18:59)
 

>> Он в словах ищет буквы и из них же маты составляет..
Чего-чего? А что еще в словах кроме букаф искать нужно?
Чем же этот скрипт так плох?! Поясните плз...

   
 
 автор: bronenos   (13.06.2007 в 20:00)   письмо автору
 
   для: kasmanaft   (13.06.2007 в 19:46)
 

да, но важен еще и порядок букв, сравните:
су|{а иди нах! (для приличия)
и
скаут пошел в поход

   
 
 автор: kasmanaft   (13.06.2007 в 20:12)   письмо автору
 
   для: bronenos   (13.06.2007 в 20:00)
 

Действительно! Букафки местами поменяли - новое слово получилось! Кто бы мог подумать :D

   
 
 автор: bronenos   (13.06.2007 в 20:39)   письмо автору
 
   для: kasmanaft   (13.06.2007 в 20:12)
 

тока скаут пошел туда не по приглашению, как могло бы показаться)

   
 
 автор: kasmanaft   (16.06.2007 в 09:02)   письмо автору
 
   для: Витос   (13.06.2007 в 18:59)
 

До меня дошло наконец-то что Вы имели ввиду... В соседней теме прочитал :)
Никаких йух, скаут и т.д. и т.п. скрипт не режет и не заменяет. Никакие буквы он сам не ищет и маты из них тоже не составляет - пропускает текст через регулярное выражение и все.
(но некоторые безобидные слова, надо заметить, тоже не пропускает)

   
 
 автор: Wyfinger   (14.06.2007 в 02:15)   письмо автору
 
   для: cheops   (13.06.2007 в 10:39)
 

Хороший скрипт, спасибо за ссылочку.

Хотя вообще-то мне еще нужен фильтр рекламы, т.е. что-то вроде почтового антиспама, может есть подобные веб-службы и их можно как-то использовать из PHP?

   
 
 автор: Trianon   (14.06.2007 в 09:37)   письмо автору
 
   для: Wyfinger   (14.06.2007 в 02:15)
 

Как Вы себе это представляете?
почтовый антиспам основан на громадного объема базах, через которые пролетает дикий траффик.
Как Вы представляете себе такую веб-службу?
Какие запросы она получает, и как на них реагирует?

   
 
 автор: cheops   (14.06.2007 в 10:23)   письмо автору
 
   для: Wyfinger   (14.06.2007 в 02:15)
 

Будут ли использоваться URL у вас в сообщениях? Т.е. можно запретить все сообщения с URL или это не допустимо?

   
 
 автор: Trianon   (14.06.2007 в 11:24)   письмо автору
 
   для: cheops   (14.06.2007 в 10:23)
 

откуда он может это знать?!
Сообщения-то не его.

   
 
 автор: cheops   (15.06.2007 в 09:51)   письмо автору
 
   для: Trianon   (14.06.2007 в 11:24)
 

Политика может быть такая - некоторые намерено запрещают размещение URL в тексте сообщения.

   
 
 автор: Wyfinger   (15.06.2007 в 04:49)   письмо автору
 
   для: cheops   (14.06.2007 в 10:23)
 

URL использоваться будут.

А как я себе это представляю?: есть же Online служба перевода (http://www.translate.ru) от PROMT, есть онлайн метаантивирусы (http://virusscan.jotti.org/, http://www.virustotal.com/) и их можно использовать и в своих скриптах (с антивирусами это сложнее, поскольку используется ajax, но все-равно). Так вот, если существует что-то подобное, отлавливающее рекламные и нецензурные сообщения, было бы неплохо, если такой системы нет - неплохо бы ее сделать.

   
 
 автор: mr Bin   (15.06.2007 в 07:04)   письмо автору
 
   для: Wyfinger   (15.06.2007 в 04:49)
 

Каким образом можно отличить рекламу от обычного сообщения?

   
 
 автор: Wyfinger   (15.06.2007 в 13:18)   письмо автору
 
   для: mr Bin   (15.06.2007 в 07:04)
 

Например преблизительно определить тематику сообщения и, если она не соответствует перечню тематик, определенных мной - выдать предупреждение.

Плюс поиск характерных слов вроде купить, продать, дешево, лучшее предложение и т.д. в различных словоформах.

   
 
 автор: Trianon   (15.06.2007 в 14:38)   письмо автору
 
   для: Wyfinger   (15.06.2007 в 13:18)
 

не понимаем....
Одна и та же фраза воспринимается по-разному, если её скажут
родственник, знакомый, деловой партнер, конкурент, фискал и посторонний.
категории можете еще добавить.

   
 
 автор: Wyfinger   (16.06.2007 в 03:11)   письмо автору
 
   для: Trianon   (15.06.2007 в 14:38)
 

Но ведь антиспам фильтры как-то работают, ничего не зная о том кем приходится мне отправитель.

Я же не говорю о строгой проверке, можно же просто делать оценку на спам, а я уже буду проверять подозрительные. Просто, чтобы не проверять все.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования