|
|
|
| Вот как строчки сравнивать я умею, а как текст сравнить? Ведь к примеру может быть текст одинаковый только где-то на пробел больше будет... как в таком случае поступать? | |
|
|
|
|
|
|
|
для: JIEXA
(30.04.2005 в 15:57)
| | Почитай про регулярные выражения, наверняка подберёшь, что либо по душе! | |
|
|
|
|
|
|
|
для: JIEXA
(30.04.2005 в 15:57)
| | А зачем собственно это надо? | |
|
|
|
|
|
|
|
для: Akira
(30.04.2005 в 16:50)
| | До вот у нас анекдотов (http://www.otvali.ru/anecdotes/) около 5.000 и теперь когда добовляешь анекдот, то не знаешь есть такой или нет такого анекдота | |
|
|
|
|
|
|
|
для: JIEXA
(30.04.2005 в 17:02)
| | Ну начнем с того , что это будет занемать ну очень много времени (если пользоваться механизмами php) Думаю php на эту роль мало подходит.
К томуже анекдот можно изменить на одну букву, строчку.
Большинство людей печатат с ошибками (как я).
Тут лучше человека не чего не придумаешь.
Ведь анекдот может быть рассказан разными словами =) , но с одинаковым смыслом =) | |
|
|
|
|
|
|
|
для: Akira
(30.04.2005 в 18:19)
| | а хоть как-нибудь если там словая одинаковые, только пробелы и переводы слово разные, можно сравнить? | |
|
|
|
|
|
|
|
для: JIEXA
(30.04.2005 в 21:17)
| | Ну сами подумайте, проше воду в ступе молоть.
Проше раз в день проверять анекдоты. | |
|
|
|
|
|
|
|
для: Akira
(30.04.2005 в 21:32)
| | ну вот что придумал:
<?
$text = "He dfds dsf fasllo";
$text2 = "He dfds dsf fa sl l o";
$text = preg_replace("/(\s+)/","",$text);
$text2 = preg_replace("/(\s+)/","",$text2);
if(!strcasecmp($text,$text2)) echo "is equal!";
?>
|
| |
|
|
|
|
|
|
|
для: isset
(30.04.2005 в 21:40)
| | Ага, я тоже про это подумал, лучше наверное не придумаешь... | |
|
|
|
|
|
|
|
для: cheops
(30.04.2005 в 22:29)
| | спасибо ребята, буду пробывать! | |
|
|
|
|
|
|
|
для: JIEXA
(30.04.2005 в 15:57)
| | Где-то в форуме пробегала статья про то, как работают поисковики (в частности, про поиск страниц с дублирующимся содержанием). Можно попопробовать реализовать похожий механизм. | |
|
|
|
|
|
|
|
для: JIEXA
(30.04.2005 в 15:57)
| | Читал тут мануал недавно на ту же примерно тему.
Вот что тебе может помочь:
int levenshtein ( string str1, string str2)
выдает число, которое означает минимальное количество вставок, замен и удалений символов, необходимое для преобразования str1 в str2.
Максимальная длина строки 255 символов
int similar_text ( string first, string second [, float percent])
Вычисляет степень похожести двух строк в процентах
Или же возможно использование полнотекстного поиска в Mysql | |
|
|
|
|
|
|
|
для: Artem S.
(30.04.2005 в 22:49)
| | Все это можно применять к чему угодно, кроме анекдотов. Анекдот - это народное творчество и один и тоже анекдот, как правило каждый рассказывает по разному. Даже Трахтенберг иногда зная анекдот, не может его угадать в своей передаче. И ты учти, что в письменном виде возможно огромное кол-во сокращений, которые сведут на нет все твои старания! Единственный выход - жестко каталогизировать и постоянно проверять новые поступления, к тому же - будешь удалять тупые!!! | |
|
|
|