搜索资源列表
javacluster
- JAVA实现文本聚类,用到TF/IDF权重,用余弦夹角计算文本相似度,用k-means进行数据聚类等数学和统计 知识。-JAVA realization of text clustering, using TF/IDF weight, calculated using cosine angle between the text of similarity, using k-means clustering for data such a
similarity
- 通过将待进行计算的向量放入二维数组中,然后编程实现皮尔森和余弦相似度公式,计算向量之间的相似度。-caculate the similarity of vector
cos
- 计算2个文档的余弦相似度,c#实现,环境是vs2010-2 documents calculate the cosine similarity, c# implementation, the environment is vs2010
similarity
- 通过将待进行计算的向量放入二维数组中,然后编程实现皮尔森和余弦相似度公式,计算向量之间的相似度。-caculate the similarity of vector
DocDistance
- java实现的文本相似度系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。-Java text similarity system, using the vector space model and the cosine similarity distance formula, the measured results can be achieved two similarity of tex
cos
- 计算词向量间的余弦相似度,用于语义文本挖掘 。(Calculate the cosine similarity between word vectors for semantic text mining.)
Kmeans
- 算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现(Algorithm idea: extract the TF/IDF weight of the document, then calculate the distance between two multidimensional vectors by cosine theo