搜索资源列表
文本相似度计算2
- 文本相似度计算,值得下载
demo
- 文本相似度比较```很好的`-text similarity comparison `` `good`
gmeans
- gmeans-- Clustering with first variation and splitting 文本聚类算法Gmeans ,使用了3种相似度函数,cosine,euclidean ,KL.文本数据使用的是稀疏矩阵形式. -gmeans clustering with first variation and splitting Gmeans,a text clustering algorithm, uses 3
countTexture
- 统计图像子区域的相似度,但图像像素信息要先存到一个文本文件中。-Statistical image sub-region similarity, but have to keep the image pixel information to a text file.
RepeatedForms
- 根据相似度去重,把文本很相似的删除掉,基于VSM的算法的实现。-According to the similarity to heavy, very similar to the text removed, the algorithm based on VSM realize.
072832
- 本文介绍了在向量空间模型下, 使用一和一两种不同的相似度评测方法, 来评测查询与文本之间的相关性。-This paper introduces the vector space model, the use of 1 and 12 kinds of different similarity evaluation methods to measure between the query and the text related to ea
text_tfidf
- 文本相似度计算(tfidf),可用文本分类以及文本信息处理-Text Similarity Computing (tfidf), available for text classification and text information processing
textFCM
- 应用FCM(模糊c均值聚类)算法到文本聚类 采用两种方法计算文本相似度 采用ShootSeg分词 采用sogou互联网词库简化特征值计算-err
javacluster
- JAVA实现文本聚类,用到TF/IDF权重,用余弦夹角计算文本相似度,用k-means进行数据聚类等数学和统计 知识。-JAVA realization of text clustering, using TF/IDF weight, calculated using cosine angle between the text of similarity, using k-means clustering for data such a
main
- 计算文本之间相似度的程序,用于文本的聚类。是在已知各个文本的文本特征向量基础上进行计算的,利用余弦值计算-Calculation of similarity between the text of the procedures for text clustering. Are known at all the text of the text feature vector calculated based on the use of c
similarity
- 文本相似度计算余弦相似度代码,计算文本相似度,用于搜索引擎-Cosine similarity of text similarity computation code, the text of the similarity calculation for the search engine
CheckText
- 实现文本相似度检查的文本层次聚类算法和划分算法的C#源码-Text to check the text similarity hierarchical clustering algorithm and classification algorithm C# source code
stex
- 用于进行字符串的匹配查找,查找整个文件夹中的文本文件。并给出相应的相似度。-Search for the string matching to find an entire folder of text files. And the corresponding similarity.
edit
- 文本相似度计算,包含编辑距离,和最长公共子序列算法的结合。-xiangsudu jisuan
(java)wenbenjulei
- 文本距离,文本相似度计算的java源代码,内含测试文档-Text from the text similarity calculation java source code, containing the test document
CompareText
- 比对两文本/字符串的相似度,利用LD矩阵算法-Compare two text/string similarity matrix algorithm using LD ..
cos
- 计算词向量间的余弦相似度,用于语义文本挖掘 。(Calculate the cosine similarity between word vectors for semantic text mining.)
文本查重
- 类说明: 名称:Contrast 描述:用于两文本进行各种方法的相似度对比。 相似度对比方法: 1.EditDistance编辑距离 2.CosineSimilarAlgorithm余弦定理 3.JianDanMoHu模糊匹配 4.综合对比,三种方法皆对比一遍,取平局值 方法:String getDegree(文本1,文本2,使用方法id)返回值为:字符串型的,相似度百分比(Class descr
相似度检测
- 可以计算文本相似度,任何语言!!!!!!!!!!!!!!!(Can calculate text similarity, any language!!!!!!!!!!!!!!!!!)
python_s
- 计算两个文本间的相似度,并且返回相速度值,用于确定两个文本将的距离(Compute the similarity between two short txts)