文件名称:crawler-on-web
介绍说明--下载内容均来自于网络,请自行研究使用
基于JAVA技术的网页内容抓取抓取http://www.tianyabook.com/sanguo/上的三国演义的所有章节内容(要求纯文本),写入sgyy.txt中。-Web page content based on JAVA technology crawl crawl all chapters on the Three Kingdoms of http://www.tianyabook.com/sanguo/ (requires plain text), written sgyy.txt in.
(系统自动生成,下载前可以参看下载内容)
下载文件列表
ReadHTML.java
ReadURL.java