Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум (новые сообщения вниз) Структурный форум

тема: Несколько идей по созданию граббера новостей

Сообщения:  [1-4] 

 
 автор: ddhvvn   (30.04.2007 в 18:56)   письмо автору
 
   для: fis   (30.04.2007 в 18:35)
 

-

   
 
 автор: fis   (30.04.2007 в 18:35)   письмо автору
 
   для: bronenos   (30.04.2007 в 18:34)
 

Не это понятно, вопрос в том чтобы найти одинаковые по смыслу статьи с разных источников.

   
 
 автор: bronenos   (30.04.2007 в 18:34)   письмо автору
 
   для: fis   (30.04.2007 в 18:21)
 

ищите ключевые слова вроде спорт, футбол, мобильные и на их основе рассовываете по категориям... а насчет хранения - однозначно, базу!

   
 
 автор: fis   (30.04.2007 в 18:21)   письмо автору
 
 

Пробую сделать новостной граббер - примерно из 130 каналов буду собирать новости.
Есть несколько проблем:
1. Каким образом можно определять схожие статьи, например можно использовать функцию similar_text. Это самый простой способ, но может быть есть еще способы для сравнения обьемных строк?
2. Где лучше хранить новости? В базе данных, или делать для каждой категории каталог, и записывать туда файлы вида 12345_news.htm и одновременно заносить инфу о файле в базу?

   

Сообщения:  [1-4] 

Форум разработан IT-студией SoftTime
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования