Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Вытащить существительные из текста
 
 автор: ДобрыйУхх   (31.03.2010 в 02:43)   письмо автору
 
 

Всем привет!

Подскажите, есть ли эффективные алгоритмы выделения,
опознавания существительного из текста? язык русский.

Вообще по окончаниям не получиться, я думаю; сравнивать каждое слово со словом из словаря,
наверно долго, даже если его перевести словарь в плоские файлы. Есть ли еще варианты?

спасибо

  Ответить  
 
 автор: Commander   (31.03.2010 в 06:58)   письмо автору
 
   для: ДобрыйУхх   (31.03.2010 в 02:43)
 

Вряд ли. Скорее всего, придется юзать словарь.

  Ответить  
 
 автор: Eugene77   (31.03.2010 в 09:25)   письмо автору
 
   для: Commander   (31.03.2010 в 06:58)
 

Существительные в тексте могут быть не только в именительном падеже и единственном числе, так что даже словарь не решит проблему.
По большому счёту эта задача неразрешима не только в русском, но и даже в английском языке.
Вот простой пример:
2 предложения:

Fruit  flies like bananes.
Time flies like arrow.

В одном предложении слово flies переводится: мушки
В другом: летит

Можно смело объявлять конкурс идей:

Кто придумает формальный алгоритм отличения глагола от существительного?
(Хотя бы для данной структуры предложения)

  Ответить  
 
 автор: Trianon   (31.03.2010 в 09:05)   письмо автору
 
   для: ДобрыйУхх   (31.03.2010 в 02:43)
 

непонятно лишь, чем плоские файлы предпочтительней обычного MySQL

  Ответить  
 
 автор: ДобрыйУхх   (31.03.2010 в 09:47)   письмо автору
 
   для: Trianon   (31.03.2010 в 09:05)
 

Не придется использовать sql сервер)), а лишь Апачь. тогда получается вместо двух ресурсов потребуется лишь один. Да и вообще на c++ может придется делать)

  Ответить  
 
 автор: ДобрыйУхх   (31.03.2010 в 09:48)   письмо автору
 
   для: ДобрыйУхх   (31.03.2010 в 02:43)
 

Ну в общем я понял)

Всем Спасибо!

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования