Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Функция levenshtein
 
 автор: Владимир55   (06.08.2007 в 09:23)   письмо автору
 
 

Натаскал из Яндекса строки длиной до 100 знаков. Абсолютно совпадающие при фильтрации удалил, но остались такие, что для компьютера разные, а по-существу одно и тоже: переставленные местами слова, разные падежи и т.п.

Хотел для их сличения использовать функцию levenshtein, но в Справочнике для меня недостаточно сведений о её практическом применении. Как на практике выбирать дополнительные параметры? И что делать с полученным значением ИПСТ?

(Справочник, стр. 84-86)

   
 
 автор: Poison   (06.08.2007 в 13:37)   письмо автору
 
   для: Владимир55   (06.08.2007 в 09:23)
 

Эта функция возвращает кол-во разницу символов.
По ней вы и решите разные строки или нет.

<%
$str1 = "Сравнить";
$str2 = "СВавнивать";

print_r(levenshtein($str1, $str2)); = 1

   
 
 автор: Владимир55   (06.08.2007 в 17:33)   письмо автору
 
   для: Poison   (06.08.2007 в 13:37)
 

С этим-то ясно!

Но ведь там есть еще хитренькие параметры cost_ins, cost_rep и cost_del ! По каким критериям их устанавливать? И результат уже будет не в виде разности знаков, а в виде какого-то ИПСТ... Как оценить по нему близость строк? Или функция с этими параметрами практического значения не имеет?

Как я понял, и функция similar_text. хотя и выдает другие параметры, но служит для этой же цели.

Какая из них "интеллектуальнее" для сравнения строк?

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования