不如我们一起做一个开源的自然语言处理项目

cris_jxg 2008-12-23
最近工作需要在做文本分类、主题词提取、相似文本检索方面的东东,查阅了不少资料,国内似乎还没有成熟的处理平台,分词程序已经不少,但与自然语言处理相关的开源项目似乎还没发现,不知大家是不是这方面的需求是不是不大?
javaeye的相似文本检索确实做到相当不错,实现上不得而知。
研究过wvtool自然语言处理平台,做得也不错,不过没有中文支持,我在集成中科院分词程序java版后,在没有自定义词库的情况下实现分类,效果也还说得过去。如果大家对这方面感兴趣,我可以对自己的研究做一个介绍,也希望能把这个东东做起来。
zhzhxh 2008-12-24
javaeye的相关性检索做得确实不错!
大家出来一块讨论下
soul_fly 2009-06-15
cris_jxg 写道
最近工作需要在做文本分类、主题词提取、相似文本检索方面的东东,查阅了不少资料,国内似乎还没有成熟的处理平台,分词程序已经不少,但与自然语言处理相关的开源项目似乎还没发现,不知大家是不是这方面的需求是不是不大?
javaeye的相似文本检索确实做到相当不错,实现上不得而知。
研究过wvtool自然语言处理平台,做得也不错,不过没有中文支持,我在集成中科院分词程序java版后,在没有自定义词库的情况下实现分类,效果也还说得过去。如果大家对这方面感兴趣,我可以对自己的研究做一个介绍,也希望能把这个东东做起来。



不错很有意思,希望加入一起做。下面是我自己做的一个中文分词系统。

Yard中文分词系统V0.1

 

wycg1984 2009-09-04
希望加入一起研究
bit6211 2009-09-09
我也想加入
zozoh 2009-09-10
先在 Google 上开个项目呗
Global site tag (gtag.js) - Google Analytics