搜索资源列表
SimWork
- 计算两篇文档相似性,可以用来查看连篇文章是否抄袭-similar calculation two documents, can be used to check whether a series of articles plagiarism
SimWork
- 计算两篇文档相似性,可以用来查看连篇文章是否抄袭-similar calculation two documents, can be used to check whether a series of articles plagiarism
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点*专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文
xml_structural_similarity
- XML文档相似性计算的一些论文,包括最近几年的文章。-Some papers of XML document similarity calculation, including articles in recent years.
similarity
- 网络爬虫相关,计算文档相似性,JAVA编写-Web crawler related document similarity calculation, JAVA write
tfidf
- 计算文档和关键之间的相似性 用于web搜索排序的研究-compute similar between query and document
wordsimilarity
- 听过扫描文档判断两个词之间相似性的代码,分别使用了文档窗口,距离为1的滑动窗口和距离为2的滑动窗口。-Listened to scan documents judge similarity between two words of the code, respectively, using the document window, a distance of a sliding window and the distance of tw
compared_two_groupofnumbers
- 在matlab环境下读取两个txt文档中的内容,并实现两个内容的相似性比较-compare with two groups of int number
检测两篇文档相似性
- 通过哈希算法实现检测文档的相似性(Similarity of detection documents by hash algorithm)