搜索资源列表
IKAnalyzer
- IKAnalyzer是中文分词工具,基于lucene2.0版本API开发,实现了以词典分词为基础的正反向全切分算法,是Lucene Analyzer接口的实现,这个是.Net版本,含有源代码-IKAnalyzer is the Chinese word segmentation tool lucene2.0 version of API-based development, the realization of a dictionary
lunce-IKAnalyzer
- 中文分词工具,利用lucence的接口写的,进行最长匹配,正向和反向匹配后根据词数选择。别人写的,我用了,觉得不错,简单,上手快-Chinese word segmentation tool lucence interface written for the longest match, the forward and reverse to match the number under the word choice. Someone
chinese_stopword
- 最全的IKAnalyz 的中文停止词集,使用时需要简单配置IKAnalyzer.cfg.xml, <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords">stopword.dic;chinese_stopword.dic;</entry>(The most complete IKAnalyz Chinese stop word
english_stopword
- 最全的IKAnalyz 的英文停止词集,使用时需要简单配置IKAnalyzer.cfg.xml, <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords">stopword.dic;english_stopword.dic;</entry>(The most complete IKAnalyz English stop word