资源列表
[搜索引擎] guangduyouxiansuosou
说明:此算法是广度优先搜索的算法实现,已通过测验。-This algorithm is a breadth-first search algorithm, has passed the test.<liuhua> 在 2025-01-06 上传 | 大小:4kb | 下载:0
[搜索引擎] spidersprinciple
说明:关于爬虫原理的,对锄想了解爬虫的人有一定帮助-failed to translate<寒枫> 在 2025-01-06 上传 | 大小:4kb | 下载:0
[搜索引擎] stop-words-list
说明:在搜索中的无效词等,包括中文,英文两个文档。基本包含了见的所有无效词-Invalid words in the search, including the English and Chinese documents. See all basically contains invalid word<iantle> 在 2025-01-06 上传 | 大小:4kb | 下载:0
[搜索引擎] Simple-collection-of-reptiles
说明:简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度- Simple collection of reptiles # 1 I just m<jt> 在 2025-01-06 上传 | 大小:4kb | 下载:0
[搜索引擎] Google-Leech_image_search
说明:Search Code with PHP code sample of Google<MHz> 在 2025-01-06 上传 | 大小:4kb | 下载:0