文件名称:webcollector-WebCollector-master
- 所属分类:
- Internet/网络编程
- 资源属性:
- [Java] [源码]
- 上传时间:
- 2016-03-16
- 文件大小:
- 10.42mb
- 下载次数:
- 0次
- 提 供 者:
- liu***
- 相关连接:
- 无
- 下载说明:
- 别用迅雷下载,失败请重下,重下不扣分!
介绍说明--下载内容均来自于网络,请自行研究使用
这是一款很好用的网络爬虫工具,具有很好的demo。-This is a good use of web crawler tool, with a good demo.
(系统自动生成,下载前可以参看下载内容)
下载文件列表
WebCollector
............\.gitignore
............\Lazy
............\....\Lazy.iml
............\....\README.md
............\....\demo_task.json
............\....\pom.xml
............\....\src
............\....\...\main
............\....\...\....\java
............\....\...\....\....\cn
............\....\...\....\....\..\edu
............\....\...\....\....\..\...\hfut
............\....\...\....\....\..\...\....\dmic
............\....\...\....\....\..\...\....\....\dm
............\....\...\....\....\..\...\....\....\..\KMeans.java
............\....\...\....\....\..\...\....\....\..\example
............\....\...\....\....\..\...\....\....\..\.......\StopWords.java
............\....\...\....\....\..\...\....\....\..\.......\WebpageKmeans.java
............\....\...\....\....\..\...\....\....\..\.......\WordsBag.java
............\....\...\....\....\..\...\....\....\webcollector
............\....\...\....\....\..\...\....\....\............\lazy
............\....\...\....\....\..\...\....\....\............\....\LazyConfig.java
............\....\...\....\....\..\...\....\....\............\....\LazyCrawler.java
............\....\...\....\....\..\...\....\....\............\....\Main.java
............\....\...\....\....\..\...\....\....\............\....\util
............\....\...\....\....\..\...\....\....\............\....\....\MongoHelper.java
............\....\...\....\resources
............\....\...\....\.........\stopwords.txt
............\NewsCrawler.java
............\README.md
............\README.zh-cn.md
............\WebCollector-Hadoop
............\...................\README.md
............\...................\build.sh
............\...................\conf
............\...................\....\crawler-default.xml
............\...................\....\hadoop
............\...................\....\......\core-site.xml
............\...................\....\......\hdfs-site.xml
............\...................\....\......\mapred-site.xml
............\...................\....\regex
............\...................\pom.xml
............\...................\src
............\...................\...\main
............\...................\...\....\java
............\...................\...\....\....\cn
............\...................\...\....\....\..\edu
............\...................\...\....\....\..\...\hfut
............\...................\...\....\....\..\...\....\dmic
............\...................\...\....\....\..\...\....\....\webcollector
............\...................\...\....\....\..\...\....\....\............\crawldb
............\...................\...\....\....\..\...\....\....\............\.......\DBReader.java
............\...................\...\....\....\..\...\....\....\............\.......\DBUpdater.java
............\...................\...\....\....\..\...\....\....\............\.......\Generator.java
............\...................\...\....\....\..\...\....\....\............\.......\Injector.java
............\...................\...\....\....\..\...\....\....\............\.......\Merge.java
............\...................\...\....\....\..\...\....\....\............\.......\SegmentUtil.java
............\...................\...\....\....\..\...\....\....\............\crawler
............\...................\...\....\....\..\...\....\....\............\.......\Crawler.java
............\...................\...\....\....\..\...\....\....\............\fetcher
............\...................\...\....\....\..\...\....\....\............\.......\Fetcher.java
............\...................\...\....\....\..\...\....\....\............\.......\FetcherOutputFormat.java
............\...................\...\....\....\..\...\....\....\............\.......\FetcherReducer.java
............\...................\...\....\....\..\...\....\....\............\.......\Visitor.java
............\...................\...\....\....\..\...\....\....\............\model
............\...................\...\....\....\..\...\....\....\............\.....\Content.java
............\...................\...\....\....\..\...\....\....\...........