文件名称:crawler4j-master
- 所属分类:
- JSP源码/Java
- 资源属性:
- [Java] [源码]
- 上传时间:
- 2016-07-11
- 文件大小:
- 151kb
- 下载次数:
- 0次
- 提 供 者:
- Micha*****
- 相关连接:
- 无
- 下载说明:
- 别用迅雷下载,失败请重下,重下不扣分!
介绍说明--下载内容均来自于网络,请自行研究使用
a small crawler demo
(系统自动生成,下载前可以参看下载内容)
下载文件列表
crawler4j-master
................\.gitignore
................\.travis.yml
................\CHANGES.txt
................\LICENSE
................\README.md
................\pom.xml
................\src
................\...\main
................\...\....\java
................\...\....\....\edu
................\...\....\....\...\uci
................\...\....\....\...\...\ics
................\...\....\....\...\...\...\crawler4j
................\...\....\....\...\...\...\.........\crawler
................\...\....\....\...\...\...\.........\.......\Configurable.java
................\...\....\....\...\...\...\.........\.......\CrawlConfig.java
................\...\....\....\...\...\...\.........\.......\CrawlController.java
................\...\....\....\...\...\...\.........\.......\Page.java
................\...\....\....\...\...\...\.........\.......\WebCrawler.java
................\...\....\....\...\...\...\.........\.......\authentication
................\...\....\....\...\...\...\.........\.......\..............\AuthInfo.java
................\...\....\....\...\...\...\.........\.......\..............\BasicAuthInfo.java
................\...\....\....\...\...\...\.........\.......\..............\FormAuthInfo.java
................\...\....\....\...\...\...\.........\.......\..............\NtAuthInfo.java
................\...\....\....\...\...\...\.........\.......\exceptions
................\...\....\....\...\...\...\.........\.......\..........\ContentFetchException.java
................\...\....\....\...\...\...\.........\.......\..........\PageBiggerThanMaxSizeException.java
................\...\....\....\...\...\...\.........\.......\..........\ParseException.java
................\...\....\....\...\...\...\.........\.......\..........\RedirectException.java
................\...\....\....\...\...\...\.........\fetcher
................\...\....\....\...\...\...\.........\.......\IdleConnectionMonitorThread.java
................\...\....\....\...\...\...\.........\.......\PageFetchResult.java
................\...\....\....\...\...\...\.........\.......\PageFetcher.java
................\...\....\....\...\...\...\.........\frontier
................\...\....\....\...\...\...\.........\........\Counters.java
................\...\....\....\...\...\...\.........\........\DocIDServer.java
................\...\....\....\...\...\...\.........\........\Frontier.java
................\...\....\....\...\...\...\.........\........\InProcessPagesDB.java
................\...\....\....\...\...\...\.........\........\WebURLTupleBinding.java
................\...\....\....\...\...\...\.........\........\WorkQueues.java
................\...\....\....\...\...\...\.........\parser
................\...\....\....\...\...\...\.........\......\BinaryParseData.java
................\...\....\....\...\...\...\.........\......\ExtractedUrlAnchorPair.java
................\...\....\....\...\...\...\.........\......\HtmlContentHandler.java
................\...\....\....\...\...\...\.........\......\HtmlParseData.java
................\...\....\....\...\...\...\.........\......\NotAllowedContentException.java
................\...\....\....\...\...\...\.........\......\ParseData.java
................\...\....\....\...\...\...\.........\......\Parser.java
................\...\....\....\...\...\...\.........\......\TextParseData.java
................\...\....\....\...\...\...\.........\robotstxt
................\...\....\....\...\...\...\.........\.........\HostDirectives.java
................\...\....\....\...\...\...\.........\.........\RobotstxtConfig.java
................\...\....\....\...\...\...\.........\.........\RobotstxtParser.java
................\...\....\....\...\...\...\.........\.........\RobotstxtServer.java
................\...\....\....\...\...\...\.........\.........\RuleSet.java
................\...\....\....\...\...\...\.........\url
................\...\....\....\...\...\...\.........\...\TLDList.java
................\...\....\....\...\...\...\.........\...\URLCanonicalizer.java
................\...\....\....\...\...\...\.........\...\