资源列表
[搜索引擎] min_distance
说明:算法原理:对由所有绿洲以及起点/终点构成的图,运用广度搜索进行遍历, 同时动态更新图中当前遍历node以及其子节点对应的distance矩阵数据项, 遍历完毕后,distance矩阵中存储的即为各个node到起点的最佳路线距离。 -Algorithm: all the Oasis, as well as by the origin/destination consisting of maps, use to traver<俊凯> 在 2024-11-14 上传 | 大小:4kb | 下载:0
[搜索引擎] VB_URL_str_parser
说明:从html文件中分离出URL地址,如搜索引擎一样,将URL地址从文件中分离出来-Html file from the URL address of isolated, such as search engines, the URL address will be separated from the document<覃东> 在 2024-11-14 上传 | 大小:4kb | 下载:0
[搜索引擎] WWW-Google-PageRank-0.12.tar
说明:Perl编写的PageRank算法,同大家分享。-PageRank algorithm based on Perl, share with all.<高宝军> 在 2024-11-14 上传 | 大小:4kb | 下载:0
[搜索引擎] guangduyouxiansuosou
说明:此算法是广度优先搜索的算法实现,已通过测验。-This algorithm is a breadth-first search algorithm, has passed the test.<liuhua> 在 2024-11-14 上传 | 大小:4kb | 下载:0
[搜索引擎] spidersprinciple
说明:关于爬虫原理的,对锄想了解爬虫的人有一定帮助-failed to translate<寒枫> 在 2024-11-14 上传 | 大小:4kb | 下载:0
[搜索引擎] stop-words-list
说明:在搜索中的无效词等,包括中文,英文两个文档。基本包含了见的所有无效词-Invalid words in the search, including the English and Chinese documents. See all basically contains invalid word<iantle> 在 2024-11-14 上传 | 大小:4kb | 下载:0
[搜索引擎] Simple-collection-of-reptiles
说明:简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度- Simple collection of reptiles # 1 I just m<jt> 在 2024-11-14 上传 | 大小:4kb | 下载:0