Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Автоматическая генерация keywords
 
 автор: JIEXA   (17.03.2005 в 16:01)   письмо автору
 
 

Невидел ли кто-нибудь скриптик, который из текста выдерал ключевые слова? Убирая html теги, знаки препинания, предлоги, союзы и т.д.

   
 
 автор: cheops   (17.03.2005 в 22:18)   письмо автору
 
   для: JIEXA   (17.03.2005 в 16:01)
 

Убрать все HTML-тэги можно при помощи скрипта приведённого в теме по ссылке http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=1562, далее можно разбить текст на отдельные слова при помощи функции preg_split
<?php
$arry_txt 
preg_split("/[,\.\s]/"$text); 
?>

Массив $arry_txt будет содержать все слова текста - остаётся только отсеять короткие слова, и убрать повторяющиеся, пропустив массив через функцию array_unique()

   
 
 автор: JIEXA   (17.03.2005 в 22:21)   письмо автору
 
   для: cheops   (17.03.2005 в 22:18)
 

Я тут попробывал вот, что получилось:
<?php
function dkeywords($keywords)
{
$keywords strip_tags($keywords);
$keywords trim($keywords);
$keywords ereg_replace('("|\?|!|:|\.|\(|\)|;|\\\\)+'' '$keywords);
$keywords str_replace('['' '$keywords);
$keywords str_replace(']'' '$keywords);
$keywords str_replace('/'' '$keywords);
$keywords str_replace('почему-то'' '$keywords);
$keywords str_replace('тут'' '$keywords);
$keywords str_replace('так'' '$keywords);
$keywords str_replace('или'' '$keywords);
$keywords str_replace('уже'' '$keywords);
$keywords str_replace('эти'' '$keywords);
$keywords str_replace('почему'' '$keywords);
$keywords str_replace('после'' '$keywords);
$keywords str_replace('когда'' '$keywords);
$keywords str_replace('зачем'' '$keywords);
$keywords str_replace('туда'' '$keywords);
$keywords str_replace('было'' '$keywords);
$keywords str_replace('вообщем'' '$keywords);
$keywords str_replace('того'' '$keywords);
$keywords str_replace('сделал'' '$keywords);
$keywords str_replace('для'' '$keywords);
$keywords str_replace('чтобы'' '$keywords);
$keywords str_replace('ведь'' '$keywords);
$keywords str_replace('можно'' '$keywords);
$keywords str_replace('если'' '$keywords);
$keywords str_replace('чего'' '$keywords);
$keywords str_replace('потому'' '$keywords);
$keywords str_replace('что'' '$keywords);
$keywords str_replace('нет'' '$keywords);
$keywords str_replace('наш'' '$keywords);
$keywords str_replace('ваш'' '$keywords);
$keywords str_replace('вашего'' '$keywords);
$keywords str_replace('этой'' '$keywords);
$keywords str_replace('будет'' '$keywords);
$keywords str_replace('них'' '$keywords);
$keywords str_replace('теперь'' '$keywords);
$keywords str_replace('делать'' '$keywords);
$keywords str_replace('через'' '$keywords);
$keywords str_replace('лучше'' '$keywords);
$keywords str_replace('сразу'' '$keywords);
$keywords str_replace('нажимаешь'' '$keywords);
$keywords str_replace('которая'' '$keywords);
$keywords str_replace('каторая'' '$keywords);
$keywords str_replace('новый'' '$keywords);
$keywords str_replace('свой'' '$keywords);
$keywords ereg_replace('( |'.CHR(10).'|'.CHR(13).')+'','$keywords);
$keywords substr($keywords,0,1600);
$keywords array_unique (explode (","$keywords));
for (
$a=0,$b=7$a sizeof($keywords) && $b 700$a++) {
if ( (
$c=strlen(@$keywords[$a])) > 2) {
@
$key_words="".$key_words.", ".$keywords[$a].""$b+=$c+2; }
}
$key_words=strtolower($key_words);
$key_words=substr($key_words2);
return 
$key_words;
}
?>

Есть идеи как улучшить?

   
 
 автор: JIEXA   (17.03.2005 в 23:35)   письмо автору
 
   для: JIEXA   (17.03.2005 в 22:21)
 

По инету попродил и ненашёл нечего свзязонного с моей задумкой :(

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования