有没有这样的英文分词器?
petrel
2009-11-17
各位好,
我对lucene还不熟,还没来得及看文档,在这里跟大家打听一下,lucene有没有这样的分词器以及相关功能。如果有的话,能否指点一下或者有无现成的支持包可供使用: 1. 在能将英文文章分解成单词的基础上,进一步将一些单词的变化形式还原成基本形式(比如过去式,过去分词,进行时,以及一些不规则的变化) 2. 能将分解成的单词index数据转换成hashset或者数组等对象便于进一步处理。 谢谢! |