Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Как сравнить два куска текста?
 
 автор: JIEXA   (30.04.2005 в 15:57)   письмо автору
 
 

Вот как строчки сравнивать я умею, а как текст сравнить? Ведь к примеру может быть текст одинаковый только где-то на пробел больше будет... как в таком случае поступать?

   
 
 автор: $OMEGA   (30.04.2005 в 16:02)   письмо автору
 
   для: JIEXA   (30.04.2005 в 15:57)
 

Почитай про регулярные выражения, наверняка подберёшь, что либо по душе!

   
 
 автор: Akira   (30.04.2005 в 16:50)   письмо автору
 
   для: JIEXA   (30.04.2005 в 15:57)
 

А зачем собственно это надо?

   
 
 автор: JIEXA   (30.04.2005 в 17:02)   письмо автору
 
   для: Akira   (30.04.2005 в 16:50)
 

До вот у нас анекдотов (http://www.otvali.ru/anecdotes/) около 5.000 и теперь когда добовляешь анекдот, то не знаешь есть такой или нет такого анекдота

   
 
 автор: Akira   (30.04.2005 в 18:19)   письмо автору
 
   для: JIEXA   (30.04.2005 в 17:02)
 

Ну начнем с того , что это будет занемать ну очень много времени (если пользоваться механизмами php) Думаю php на эту роль мало подходит.
К томуже анекдот можно изменить на одну букву, строчку.
Большинство людей печатат с ошибками (как я).
Тут лучше человека не чего не придумаешь.
Ведь анекдот может быть рассказан разными словами =) , но с одинаковым смыслом =)

   
 
 автор: JIEXA   (30.04.2005 в 21:17)   письмо автору
 
   для: Akira   (30.04.2005 в 18:19)
 

а хоть как-нибудь если там словая одинаковые, только пробелы и переводы слово разные, можно сравнить?

   
 
 автор: Akira   (30.04.2005 в 21:32)   письмо автору
 
   для: JIEXA   (30.04.2005 в 21:17)
 

Ну сами подумайте, проше воду в ступе молоть.
Проше раз в день проверять анекдоты.

   
 
 автор: isset   (30.04.2005 в 21:40)   письмо автору
 
   для: Akira   (30.04.2005 в 21:32)
 

ну вот что придумал:

<?
$text 
"He dfds dsf             fasllo";
$text2 "He dfds dsf  fa  sl l o";

$text preg_replace("/(\s+)/","",$text);
$text2 preg_replace("/(\s+)/","",$text2);

if(!
strcasecmp($text,$text2)) echo "is equal!";

?>

   
 
 автор: cheops   (30.04.2005 в 22:29)   письмо автору
 
   для: isset   (30.04.2005 в 21:40)
 

Ага, я тоже про это подумал, лучше наверное не придумаешь...

   
 
 автор: JIEXA   (30.04.2005 в 22:33)   письмо автору
 
   для: cheops   (30.04.2005 в 22:29)
 

спасибо ребята, буду пробывать!

   
 
 автор: Loki   (30.04.2005 в 17:42)   письмо автору
 
   для: JIEXA   (30.04.2005 в 15:57)
 

Где-то в форуме пробегала статья про то, как работают поисковики (в частности, про поиск страниц с дублирующимся содержанием). Можно попопробовать реализовать похожий механизм.

   
 
 автор: Artem S.   (30.04.2005 в 22:49)   письмо автору
 
   для: JIEXA   (30.04.2005 в 15:57)
 

Читал тут мануал недавно на ту же примерно тему.
Вот что тебе может помочь:

int levenshtein ( string str1, string str2)
выдает число, которое означает минимальное количество вставок, замен и удалений символов, необходимое для преобразования str1 в str2.
Максимальная длина строки 255 символов

int similar_text ( string first, string second [, float percent])
Вычисляет степень похожести двух строк в процентах

Или же возможно использование полнотекстного поиска в Mysql

   
 
 автор: $OMEGA   (01.05.2005 в 01:24)   письмо автору
 
   для: Artem S.   (30.04.2005 в 22:49)
 

Все это можно применять к чему угодно, кроме анекдотов. Анекдот - это народное творчество и один и тоже анекдот, как правило каждый рассказывает по разному. Даже Трахтенберг иногда зная анекдот, не может его угадать в своей передаче. И ты учти, что в письменном виде возможно огромное кол-во сокращений, которые сведут на нет все твои старания! Единственный выход - жестко каталогизировать и постоянно проверять новые поступления, к тому же - будешь удалять тупые!!!

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования