搜索资源列表
DataAnalyze
- 数据挖掘算法,从文本中读取数据,耗时少,效率高-data mining algorithms, reading from the text data and less time-consuming, high efficiency
DBSCAN_JAVA
- DBSCAN算法的JAVA实现,可以在D:\使用text.txt数据文件来进行DBSCAN聚类-DBSCAN algorithm JAVA, the D : \ text.txt data files used for clustering DBSCAN
ANewmethod
- 一种文本分类数据挖掘的技术,比较几种不同的文本分类方法,重点介绍熵。-A text classification data mining techniques to compare several different text classification methods, focusing on entropy.
corrected
- 第五届知识发现和数据挖掘国际会议提供的数据进行实验测试,包括DOS、U2R、R2L、probing等四大类22种有代表性的攻击以及大量正常数据。用corrected.gz数据作为测试数据-Fifth Knowledge Discovery and Data Mining International Conference on data provided by laboratory tests, including DOS, U2R, R
tm_0.3
- R-Project是一个开源的统计软件,专门有一个R语言,类似S语言,这个包里面就是一个R实现的文本挖掘(text mining简称tm)的包.里面有代码和样本数据.-R-Project is an open source statistical software, has a dedicated R language, similar to S language, this is an R package which realize
SogouC.mini.20061127
- 文本分类现成语料库,是SogouC.mini.20061127.zip格式的,可用于web数据挖掘-Off-the-shelf text classification corpus is SogouC.mini.20061127.zip format, can be used for web data mining
text-data-mining
- 此程序实现了如何在TXT或WORD文档中进行数据挖掘,在文本中提取有用信息-The realization of this procedure how to TXT or WORD document to carry out data mining, in the text to extract useful information
RTFLib
- 一个封装好的类(RichText Builder (StringBuilder for RTF).可以将Rich Text控件中的内容直接保存为RTF格式文件.-A good type of package (RichText Builder (StringBuilder for RTF). Could be in the Rich Text content controls directly saved as RTF files.
ke_yan_guan_li
- 主要功能 基础数据库建设 数据导入导出-建库 数据仓库-数据挖掘(查询、排序、打印、统计、报表、批处理 数据管理--数据新增、修改等审核流程 综合考评 年度统计 门户管理 功能介绍 人员管理子系统 提供了人员、机构的各种信息。能够对人员增加、删除、修改、通用性查找、自定义搜索条件和显示字段生成模板进行智能化查找。能够对人员信息进行如年龄范围,指定职务等条件的文字统计和图形统计和报表,可以将人员信息导出成Excel格式。 机构管理子系统
Discover
- 一个相对很完善的数据挖掘系统(少部分功能欠缺),不仅包括了按类Association(内含Apriori,C4.5,GrowTree),Classification(ID3),Cluster划分常用的算法及个人优化后的算法。同时包含了多种数据源(MS Access,Excel,SQL Server,TEXT)的界面直接连接方式。界面方面更像一个专业的系统,采用了类VC浮动多框架界面,也可以作为界面编程的参考。这个工程的分数和其他小工具的
The-text-data-about-data-mining-algorithms
- 文本数据的数据挖掘算法:对大量存在的文本数据,用已有的结构化数据挖掘技术,提出了非结构化数据知识发现方法。-The text data about data mining algorithms
stop_word
- 停用词库,四川大学机器智能实验室。用于文本数据挖掘的预处理。-Disable thesaurus, Sichuan University, Machine Intelligence Laboratory. Pre-processing for text data mining.
text_data_mining
- java编写的数据挖掘方面的代码,里面包含有文本分类,作者身份识别方面的java源码,本人亲自参与编写-java code about data mining;include:text cluster ,authorship identification,
lda-0.1-matlab
- lda是一个集合概率模型,主要用于处理离散的数据集合,目前主要用在数据挖掘(dm)中的text mining和自然语言处理中,主要是用来降低维度的-lda is a set of probability models, mainly for dealing with discrete data sets, the key used in data mining (dm) in the text mining and natural la
57578895BAYES
- 用基于贝叶斯的的方法对文本进行分类主要用于数据挖掘领域-Using the method based on Bayesian text classification is mainly used for data mining
1
- 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已
Machine-learning-and-data-mining
- 机器学习与数据挖掘:方法和应用,本书分为5个部分,共18章,较为全面地介绍了机器学习的基本概念,并讨论了数据挖掘和知识发现中的有关问题及多策略学习方法,具体地阐述了机器学习与数据挖掘在工程设计,文本、图像和音乐,网页分析、计算机病毒和计算机控制,医疗诊断、生物医疗信号分析和水质分析中的生物信号处理等方面的应用情况。-Machine learning and data mining: methods and applications, t
data-mining
- 涉及到了文本挖掘方面的好多内容,有意请下载-text mining algorithm
The-progress-of-text-mining-research
- 挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程.-Text mining,also known as text data mining or text knowledge discovery,means discovering implicit,previously unknown,and potentially useful patterns in large amou