|
|
|
| Всем привет!
Подскажите, есть ли эффективные алгоритмы выделения,
опознавания существительного из текста? язык русский.
Вообще по окончаниям не получиться, я думаю; сравнивать каждое слово со словом из словаря,
наверно долго, даже если его перевести словарь в плоские файлы. Есть ли еще варианты?
спасибо | |
|
|
|
|
|
|
|
для: ДобрыйУхх
(31.03.2010 в 02:43)
| | Вряд ли. Скорее всего, придется юзать словарь. | |
|
|
|
|
|
|
|
для: Commander
(31.03.2010 в 06:58)
| | Существительные в тексте могут быть не только в именительном падеже и единственном числе, так что даже словарь не решит проблему.
По большому счёту эта задача неразрешима не только в русском, но и даже в английском языке.
Вот простой пример:
2 предложения:
Fruit flies like bananes.
Time flies like arrow.
|
В одном предложении слово flies переводится: мушки
В другом: летит
Можно смело объявлять конкурс идей:
Кто придумает формальный алгоритм отличения глагола от существительного?
(Хотя бы для данной структуры предложения) | |
|
|
|
|
|
|
|
для: ДобрыйУхх
(31.03.2010 в 02:43)
| | непонятно лишь, чем плоские файлы предпочтительней обычного MySQL | |
|
|
|
|
|
|
|
для: Trianon
(31.03.2010 в 09:05)
| | Не придется использовать sql сервер)), а лишь Апачь. тогда получается вместо двух ресурсов потребуется лишь один. Да и вообще на c++ может придется делать) | |
|
|
|
|
|
|
|
для: ДобрыйУхх
(31.03.2010 в 02:43)
| | Ну в общем я понял)
Всем Спасибо! | |
|
|
|