搜索资源列表
bogofilter-0.93.4.tar
- 开源项目BOGOFILTER的源码.该项目实现BAYES文本分类算法,不过该源码只支持英文的分词
SVM分类器
- SVM文本分类器源程序,英文界面,包含语料,没有解压缩密码-SVM text classifier source, English interface, including Corpus, not extract passwords
SVM分类器
- SVM文本分类器源程序,英文界面,包含语料,没有解压缩密码-SVM text classifier source, English interface, including Corpus, not extract passwords
Native_Byes_Classfication
- 一个朴素贝叶斯文本分类,在进行训练后,可以对文本进行分类。目前支持英文-a simple Bayesian text classification, conducting training, the text can be classified. Currently supported English
bogofilter-0.93.4.tar
- 开源项目BOGOFILTER的源码.该项目实现BAYES文本分类算法,不过该源码只支持英文的分词-Open-source projects the source BOGOFILTER. The realization of the project BAYES text classification algorithm, but the source code only supports the English word
reuters21578
- 这是一个英文的语料库,可以用于进行文本的分类与聚类。是文本分类领域共用的一个语料库。-This is a corpus of English, can be used for text classification and clustering. The field of text classification is a common corpus.
Bayes_1
- 首先,对CATEGORY中的txt文件分类; 其次,对多个txt文件中的英文文本进行分词; 最后,通过贝叶斯公式进行分类;-First, in the txt file CATEGORY classification Secondly, multiple txt files in English text word Finally, by Bayes formula to be classified
Wordfrequencystatistics
- 对英文文章的单词进行统计词频 并输出 主要应用文本分类中的对文章的处理-Word article on the English word frequency and the output of the main statistical application of text categorization of the articles deal with
onTextCategorization
- 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增 益IG、互信息MI、V2分布CHI 四种不同的特征选取方法。采用支持向量机(SVM) 和KNN两种不同的分类 器以考察不同抽取方法的有效性。实验结果表明, 在英文文本分类中表现良好的特征抽取方法( IG、MI 和 CHI)在不加修正的情况下并不适合中文文本分类。文中从理论上分析了产生差异的原因, 并分析了可能的 矫正方法包括采用超大规
Bayes-classifier-code
- 朴素贝叶斯分类器程序代码 采用朴素贝叶斯分类器算法,使用C++语言对英文文本进行分类,实现了一个文本分类器功能-Naive Bayesian classifier program code using Bayesian classification algorithm, using C++ language English text classification, to achieve a text classification f
toolkit_for_words_En
- 处理英文中的停词、同词干词,不改变文章结构。适用于文本分类、文本聚类、推荐预处理。-Processing of stop words in English, with the stem word, does not change the structure of the article. Suitable for text categorization, text clustering, recommend pretreatment.
pj1_test_new
- 该项目实现将英文文本文件中的单词分类并排序的功能。利用二叉树,快速排序等算法大大提高了代码的执行效率。-The project will achieve the English word text file classification and sorting functions. Use binary, fast sorting algorithm greatly improve the efficiency of the code.
CLASSIFICATION-with-newsgroup
- 多文本分类,KNN和朴素贝叶斯算法,英文文本,-Text categorization, KNN and naive bayes algorithm, the English text,
jevmkm
- SVM文本分类器源程序,英文界面,包含语料,没有解压缩密码,-The SVM classifier source program text, English interface, contains the corpus, not unzip password,
95777978
- SVM文本分类器源程序,英文界面,包含语料,没有解压缩密码,-The SVM classifier source program text, English interface, contains the corpus, not unzip password,
nklrc
- SVM文本分类器源程序,英文界面,包含语料,没有解压缩密码,-The SVM classifier source program text, English interface, contains the corpus, not unzip password,
Yhglish
- SVM文本分类器源程序,英文界面,包含语料,没有解压缩密码,(The SVM classifier source program text, English interface, contains the corpus, not unzip password,)
black
- SVM文本分类器源程序,英文界面,包含语料,没有解压缩密码,()
work
- 贝叶斯下文本分类器,python语言,包括中文分词和英文分词(Bias's lower text classifier, python language, including Chinese participle and English participle)
rt-polaritydata
- 该文档可在机器学习中用于文本分类的语料库,内涵一个正面语料文档和一个负面语料文档。(This document is a corpus for text categorization in machine learning, with a positive corpus document and a negative corpus document.)