搜索资源列表
文件相似度比较器
- 文件相似度比较器: 1。 采用标准的 Levenshtein Distance 算法计算两个文件的相似度。 2。 程序使用简单。选入多个文件,然后按分析便个分析出两个文件之间的相似程度。 3。 发现问题欢迎和我讨论。 E-mail: hackerqc@gmail.com-document similarity comparison : 1. Standard Levenshtein Distance algorithm si
med
- 最小编辑距离,可以计算2个字符串的相似度,用于语音文档检索-Minimum edit distance between two strings can calculate the similarity for retrieval of voice files
FileCmp
- 本程序用于文档相似度的匹配,判别文档的雷同,能够显示文档的相似率!-Using in comparing the same rates among files .
File22
- 基于关键词的Web文档自动分类算法研究,文档关键词,语义相似度,聚类算法,知网,拓扑网络图,中文分词-Keyword-based Web Document Classification Algorithm, document keywords, semantic similarity, clustering algorithm, HowNet, topological network diagrams, Chinese word seg
1
- 基于面向对象编程的文档向量相似度匹配算法-Object-oriented programming document vector similarity matching algorithm
(java)wenbenjulei
- 文本距离,文本相似度计算的java源代码,内含测试文档-Text from the text similarity calculation java source code, containing the test document
knn
- 文本分类,用KNN方法,通过计算其相似度,找出与它靠近的K个文档。-text classify
DocumentComparison
- 使用vsm模型对文档的相似度进行分析,以前一百篇文档为查询条件-Vsm model used to analyze the similarity of the document
cos
- 计算2个文档的余弦相似度,c#实现,环境是vs2010-2 documents calculate the cosine similarity, c# implementation, the environment is vs2010
Text-Retrieval
- 信息检索系统从最初的纯手工检索系统业已发展到现在的以信息技术为支撑的检索系统,在这一过程中,适应新的信息资源、信息技术这些检索环境,提高信息检索系统的查全率、查准率和系统响应时间是不变的主题,在众多文本中掌握最有效的信息始终是信息处理的一大目标。围绕向量空间模型设计了一个文本检索系统,介绍向量空间模型的基础上给出了基于它的信息检索系统的一般结构框架和各部分的功能,探讨了系统中所涉及到的关键技术。用向量空间模型进行特征表达,用TF-IDF
LSA
- 潜在语义分析 LSA(latent semantic analysis)潜在语义分析,也被称为LSI(latent semantic index),是Scott Deerwester, Susan T. Dumais等人在1990年提出来的一种新的索引和检索方法。它解决了传统的关键词直接索引方法的同义词问题。该方法提出了潜在语义空间,即将文档投影到潜在语义空间中,通过文档间的位置关系判断文档的相似度。在该空间中,具有同义词的文档相互靠近
The-code-of-VSM-java
- 利用java代码实现向量空间模型,通过词频,文档频率计算相似度的值。-Using the language to get the value of VSM
123
- 通过图模型表示本体中概念以及概念之间的语 义关系,用来将一个概念和一个文档扩展为一个语义模糊集,并计算模糊集合之间的相似度。-Between the concept and the concept of language in the body through the graph model Justice relationship, to a conceptual and a document extension is a s
TextRetrieval
- 基于wvtool的文件检索。根据文档相似度查找相似主题。-Wvtool-based file retrieve. Find similar theme based on similarity.
src
- 中文文档相似度比较,使用的是c#语言写的-Chinese document similarity comparison using c# language written
6189061
- 用VC++实现的文档相似度比较工具,可以对txt文档进行内容相似度比较-With VC++ implementation of document similarity comparison tool, you can txt document content similarity comparison
similarity8
- 采用欧几里德距离等分析手段对两个text文档的相似度进行比较。-The similarity of the two text documents were compared using the Euclidean distance method.
Document-retrieval-procedure
- 文档检索工具 基本功能 把一个或多个单词作为查询条件,从若干英文文本文档中查找相关文档,并显示查找结果(包括各单词在各文档中出现的次数)。 高级功能 从文本文档中提取单词,建立单词库。 基于单词建立文档索引库。 根据查询条件计算文档的相似度(可以是查询条件中单词在文档中出现的次数)。 根据文档相似度对相关文档进行排序。 -Document retri tools The basic
work
- 信息检索课程,向量模型检索代码。计算不同文档内容之间的相似度,计算cos函数及余弦相似度。结果为相似度排序- U4FE1 u606F u686.0 u8B0 u7B22 u8B0 u7B09 u4B0 U954 u7F4 u7F8 u4F3 u5F6 u5F6 u5F6
协同过滤算法
- 文本聚类(Text clustering)文档聚类主要是依据著名的聚类假设:同类的文档相似度较大,而不同类的文档相似度较小。作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力,已经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注。(Text clustering document clustering is based on t