资源列表
[中文信息处理] libcharguess-src-1.0b.tar
说明:判断一串字符是属于什么字符集的程序,如判断是否属于utf-8,gb2312<paladin> 在 2008-10-13 上传 | 大小:248.27kb | 下载:0
[中文信息处理] TextClassify
说明:文本分类算法,含有三个分类算法,朴素贝叶斯,KNN,VSM<lingqiang> 在 2008-10-13 上传 | 大小:2.27mb | 下载:1
[中文信息处理] lunce-IKAnalyzer
说明:中文分词工具,利用lucence的接口写的,进行最长匹配,正向和反向匹配后根据词数选择。别人写的,我用了,觉得不错,简单,上手快<xielang> 在 2008-10-13 上传 | 大小:848.23kb | 下载:0
[中文信息处理] fenci_ICTCLAS
说明:基于中科院计算所的ICTCLAS系统开发的分词工具,只有一个类,上手最快,功能强大<xielang> 在 2008-10-13 上传 | 大小:2.13mb | 下载:0
[中文信息处理] OnCorpusNew
说明:中文信息处理的源程序,用于分词过程中的歧义鉴别与排除,vc++编写,.cpp文件<张莉> 在 2008-10-13 上传 | 大小:2.73kb | 下载:0
[中文信息处理] taggingPOS
说明:中文信息处理的源程序,用于设置词汇在文本中的位置信息,vc++编程,.cpp文件<张莉> 在 2008-10-13 上传 | 大小:2.18kb | 下载:0
[中文信息处理] hanzibianma
说明:介绍关于解决汉字问题的文章。 讲解了在编程过程中的汉字编码。<limaorui> 在 2008-10-13 上传 | 大小:11.03kb | 下载:0
[中文信息处理] CRF1-2.tar
说明:CRF分类器,是一个很好的研究工具.用于中文信息处理的很好的工具<wangtao> 在 2008-10-13 上传 | 大小:1.74mb | 下载:0