Как сравнить два куска текста?

Главная страница

Создание сайтов

Блог Кузнецова М.В.

Статьи о PHP

PHP-скрипты

Статьи об Apache

Форум С++

Консультации

Форум "Про Жизнь"

Форум:	Форум PHP	Форум Apache	Форум Регулярные Выражения	Форум MySQL	HTML+CSS+JavaScript	Форум Flash	Разное
Новые темы:	0	0	0	0	0	0	0

Здравствуйте, Посетитель!

вид форума:

тема: Как сравнить два куска текста?

следующая тема

предыдущая тема

	автор: JIEXA (30.04.2005 в 15:57) письмо автору
	Вот как строчки сравнивать я умею, а как текст сравнить? Ведь к примеру может быть текст одинаковый только где-то на пробел больше будет... как в таком случае поступать?

	автор: $OMEGA (30.04.2005 в 16:02) письмо автору
	для: JIEXA (30.04.2005 в 15:57)
	Почитай про регулярные выражения, наверняка подберёшь, что либо по душе!

	автор: Akira (30.04.2005 в 16:50) письмо автору
	для: JIEXA (30.04.2005 в 15:57)
	А зачем собственно это надо?

	автор: JIEXA (30.04.2005 в 17:02) письмо автору
	для: Akira (30.04.2005 в 16:50)
	До вот у нас анекдотов (http://www.otvali.ru/anecdotes/) около 5.000 и теперь когда добовляешь анекдот, то не знаешь есть такой или нет такого анекдота

	автор: Akira (30.04.2005 в 18:19) письмо автору
	для: JIEXA (30.04.2005 в 17:02)
	Ну начнем с того , что это будет занемать ну очень много времени (если пользоваться механизмами php) Думаю php на эту роль мало подходит. К томуже анекдот можно изменить на одну букву, строчку. Большинство людей печатат с ошибками (как я). Тут лучше человека не чего не придумаешь. Ведь анекдот может быть рассказан разными словами =) , но с одинаковым смыслом =)

	автор: JIEXA (30.04.2005 в 21:17) письмо автору
	для: Akira (30.04.2005 в 18:19)
	а хоть как-нибудь если там словая одинаковые, только пробелы и переводы слово разные, можно сравнить?

	автор: Akira (30.04.2005 в 21:32) письмо автору
	для: JIEXA (30.04.2005 в 21:17)
	Ну сами подумайте, проше воду в ступе молоть. Проше раз в день проверять анекдоты.

автор: isset (30.04.2005 в 21:40) письмо автору

для: Akira (30.04.2005 в 21:32)

ну вот что придумал:

<? $text = "He dfds dsf fasllo"; $text2 = "He dfds dsf fa sl l o"; $text = preg_replace("/(\s+)/","",$text); $text2 = preg_replace("/(\s+)/","",$text2); if(!strcasecmp($text,$text2)) echo "is equal!"; ?>

	автор: cheops (30.04.2005 в 22:29) письмо автору
	для: isset (30.04.2005 в 21:40)
	Ага, я тоже про это подумал, лучше наверное не придумаешь...

	автор: JIEXA (30.04.2005 в 22:33) письмо автору
	для: cheops (30.04.2005 в 22:29)
	спасибо ребята, буду пробывать!

	автор: Loki (30.04.2005 в 17:42) письмо автору
	для: JIEXA (30.04.2005 в 15:57)
	Где-то в форуме пробегала статья про то, как работают поисковики (в частности, про поиск страниц с дублирующимся содержанием). Можно попопробовать реализовать похожий механизм.

	автор: Artem S. (30.04.2005 в 22:49) письмо автору
	для: JIEXA (30.04.2005 в 15:57)
	Читал тут мануал недавно на ту же примерно тему. Вот что тебе может помочь: int levenshtein ( string str1, string str2) выдает число, которое означает минимальное количество вставок, замен и удалений символов, необходимое для преобразования str1 в str2. Максимальная длина строки 255 символов int similar_text ( string first, string second [, float percent]) Вычисляет степень похожести двух строк в процентах Или же возможно использование полнотекстного поиска в Mysql

	автор: $OMEGA (01.05.2005 в 01:24) письмо автору
	для: Artem S. (30.04.2005 в 22:49)
	Все это можно применять к чему угодно, кроме анекдотов. Анекдот - это народное творчество и один и тоже анекдот, как правило каждый рассказывает по разному. Даже Трахтенберг иногда зная анекдот, не может его угадать в своей передаче. И ты учти, что в письменном виде возможно огромное кол-во сокращений, которые сведут на нет все твои старания! Единственный выход - жестко каталогизировать и постоянно проверять новые поступления, к тому же - будешь удалять тупые!!!