搜索资源列表
分词器
- 迷你分词器,解压缩后,在java环境下运行使用。
docTokenizer
- 一个简单的中文分词器,java语言描述,并附带-a simple Chinese word for that java language to describe and fringe
ChineseAnalyzer
- lucene.net 2.0的中文分词器,采用最大向前匹配算法,附上源代码和lucene.net.dll,希望这方面有兴趣的互相交流一下。
k50RVZDojs03
- 基于IKAnalyzer分词算法的准商业化Lucene中文分词器
中文网页自动分类器
- 利用knn算法实现了一个中文网页自动分类器, 包括网页预处理,ictclas中文分词,基于tf-idf的文本特征表示,基于df的特征选取和基于knn的分类算法,最后通过struts2框架web发布
分词器
- 迷你分词器,解压缩后,在java环境下运行使用。-Mini-sub-word, unzip it, run under the environment in the use of java.
TextCategorization
- 基于朴素贝叶斯算法实现的中文文本分类程序。可以对中文文本进行分类识别,使用时先对分类器进行训练,然后进行识别。该Beta版本仅支持对3类文本进行分类,使用简单的中文分词方法,本程序尚不具备实用性,用于算法研究和改进。-based on Bayesian algorithms to achieve the Chinese text classification procedure. Can the Chinese text classif
docTokenizer
- 一个简单的中文分词器,java语言描述,并附带-a simple Chinese word for that java language to describe and fringe
ChineseAnalyzer
- lucene.net 2.0的中文分词器,采用最大向前匹配算法,附上源代码和lucene.net.dll,希望这方面有兴趣的互相交流一下。-lucene.net 2.0 of the Chinese word segmentation, and using the forward matching algorithm, together with source code and lucene.net.dll, hope in this
k50RVZDojs03
- 基于IKAnalyzer分词算法的准商业化Lucene中文分词器-IKAnalyzer segmentation algorithm based on quasi-commercial Lucene Chinese Word Breaker
Classifier4J-0.6-dist
- Classifier4J是一个很好的基于java的分类器,里面有Native bayes和KNN等方法的文本分类.另外还 提供了分词和自动摘要等功能-Classifier4J is a very good java-based classifier, which has Native bayes and KNN methods, such as text classification. It also provides a summar
ICTCLAS
- ICTCLAS分词,来自中科院的分词器,可以提取指纹的等功能-ICTCLAS
CutWordApp
- csharp实现的分词器,完整可以运行!结合正向逆向匹配法,效率较高-csharp device to achieve the sub-word, complete run! Forward Reverse with matching, more efficient
svmcls-(2)
- 李荣陆老师做的文本分类器,用中科院分词系统做的,分类方法用的是SVM和K-Rong Lu teachers do text classification, word segmentation system with the Chinese Academy of Sciences to do, classification using a SVM and KNN
FMM
- java源码分词器,导入eclipse即可使用,无需修改代码,分词效果还行(Java source code word segmentation, import eclipse can use, without modifying the code, the word segmentation effect is OK)
apache-cxf-3.0.9
- 分词分析 软件复用是在软件开发中避免重复劳动的解决方案。Web服务实现了业务级别的软件复用,例如在B2B的集成中,各企业之间通过互相调用Web服务,实现了Web服务的共享,Web服务的使用企业不需要再重新开发其他企业中已经存在的服务。(Segmentation analysis)
IK Analyzer 2012FF_hf1
- ik分词器源码,非常的好用,能够智能分词,检索命中率比较高的。(ik analyse code,it is useful)
课程设计作业
- 用分词包进行分词,并通过分词统计每个词频出现次数(use to seperate an article, and use the dictionary to find the frequency of each word)
paoding-analysis-2.0.4-beta
- paoding-dic-home.properties是庖丁解牛中文分词的配置文件 庖丁解牛分词器是基于lucene的中文分词系统的软件。(Paoding-dic-home.properties is Chinese Paodingjieniu participle configuration file Is Chinese Paodingjieniu segmentation segmentation system based o
基于mmseg算法的一个轻量级中文分词器
- 基于mmseg算法的一个轻量级开源中文分词器(A lightweight open source Chinese word segmentation based on the mmseg algorithm)