资源列表
[搜索引擎] larbin-2.6.3
说明:larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。 Larbin只是一个爬虫,也就是说larbin只抓取网页,至于如何parse的事情则由用户自己完成。另外,如何存储到数据库以及建立索引的事情 larbin也不提供。 latbin最初的设计也是依据设计简单但是高度可配置性的原则,因此我们可<zfnh> 在 2024-11-13 上传 | 大小:164kb | 下载:0
[搜索引擎] SearchTechnology
说明:互联网搜索技术 检索与排序PPT 索引技术 排序 性能评测-Internet search technology, search and sort to sort PPT Indexing performance evaluation<舒畅> 在 2024-11-13 上传 | 大小:539kb | 下载:0
[搜索引擎] textcluster
说明:文本聚类算法源码,包含tf.idf计算的实现,采用java语言编写-text cluster algorithm, including the computation of tf.idf ,written by Java<谭磊> 在 2024-11-13 上传 | 大小:9kb | 下载:0
[搜索引擎] googlesample
说明:使用google搜索引擎的一个典型的例子-Use google search engine, a typical example of<583540466> 在 2024-11-13 上传 | 大小:311kb | 下载:0
[搜索引擎] chuizhisearch
说明:wangbo垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合;-wangbo vertical search engine that fully open-source version of one. front with Lucene s<yangyu> 在 2024-11-13 上传 | 大小:5.82mb | 下载:0
[搜索引擎] BasedontheLuceneinformationretrievalresearchandapp
说明:Based on the Lucene information retrieval research and application<huihui> 在 2024-11-13 上传 | 大小:405kb | 下载:0