搜索资源列表
Superyy
- 一个分词的源码,采用正向最大匹配的策略,用过测试-A sub-term source, the use of forward maximum matching strategy used to test
splitword
- 自己写的小分词程序,中文分词测试版,仅供参考,谢谢!-Writing their own small sub-term process, English sub-test version of the word, for reference purposes only, thank you!
WordSegment
- 很简单的中文分词程序,命令行程序,在VisualStudio2008中调试通过,内附测试文档。-Chinese language is very simple segmentation procedures, command-line procedures, the debugging of VisualStudio2008 passed, the document containing the test.
Wordseg
- 该程序是采用的java语言对测试文本进行中文分词-Chinese segmenter
luceneCH2
- 亲自测试成功的《开发自己的搜索引擎》第二章,以及一个分词器的测试程序。-Personally successfully tested a " to develop its own search engine" second chapter, as well as a word breaker testing procedures.
TokenTest
- 电信行业,此代码是地址搜索程序的一部分,该代码的功能是分词的测试程序。-Telecommunications industry, address search program, the function of this code is written in the sub-word test.
ICTCLAS_Demo
- 该程序用于短信过滤分析,首先使用ICTCLAS分词系统对输入短信进行分词,接着使用贝叶斯算法分析训练模型。最后对测试集中的短信进行垃圾短信预测。由于短信涉及个人隐私,使用时请自行添加训练数据集和测试数据集-The procedures used for SMS filtering analysis, the first to use the segmentation the ICTCLAS segmentation system inp
ChineseSegment
- 一个完整的中文分词程序,有源码,词典,训练集。算法简洁高效,准确率高。包含了一种将标注语料和词典融合的新型分词方法。将语料分割为2:1为训练集和测试集,加上一个外部词典,准确率可以达到95 。适合入门者学习。也适合需要一个简单分词工具的应用。-A Chinese word segmentation procedures, source, dictionary, the training set. The algorithm is sim
fencisuanfa
- 正逆向的分词算法 已经测试通过了 里面有完整的源码 和测试程序-Forward and reverse segmentation algorithm has been tested by the complete source code and testing procedures
MyPaodingTest
- 一个中文分词 庖丁的测试程序 仅供初学者参考-paoding Test project
ansj_seg-master
- 一个功能非常全面的分词程序,内部有许多测试类可以使用,包含了词频的统计功能在其中,可以-A very comprehensive segmentation procedures, internal classes can use many tests, including word frequency statistics function in which you can see under the next
NlpAnalysiTest
- 自然语言处理中,最基础的分词测试程序,采用CRF模型-Natural language processing, the most basic word test program, using CRF model
NLpirTest
- 使用中文信息处理的开源工具包NLpir完成分词工作(Use the Open Source Toolkit NLpir to do word segmentation)