文件名称:Java-readability-master
- 所属分类:
- JSP源码/Java
- 资源属性:
- [Java] [源码]
- 上传时间:
- 2014-05-04
- 文件大小:
- 34kb
- 下载次数:
- 1次
- 提 供 者:
- 冯**
- 相关连接:
- 无
- 下载说明:
- 别用迅雷下载,失败请重下,重下不扣分!
介绍说明--下载内容均来自于网络,请自行研究使用
web 页面解析
1. web 页面抓取
2. html 正文提取-html context extractor
1. web 页面抓取
2. html 正文提取-html context extractor
(系统自动生成,下载前可以参看下载内容)
下载文件列表
Java-readability-master
.......................\.gitignore
.......................\README
.......................\pom.xml
.......................\src
.......................\...\main
.......................\...\....\java
.......................\...\....\....\com
.......................\...\....\....\...\basistech
.......................\...\....\....\...\.........\readability
.......................\...\....\....\...\.........\...........\AbstractPageReader.java
.......................\...\....\....\...\.........\...........\FilePageReader.java
.......................\...\....\....\...\.........\...........\HtmlPage.java
.......................\...\....\....\...\.........\...........\HttpPageReader.java
.......................\...\....\....\...\.........\...........\NekoJsoupParser.java
.......................\...\....\....\...\.........\...........\OffsetRange.java
.......................\...\....\....\...\.........\...........\PageCharsetDetector.java
.......................\...\....\....\...\.........\...........\PageInfo.java
.......................\...\....\....\...\.........\...........\PageLinkInfo.java
.......................\...\....\....\...\.........\...........\PageReadException.java
.......................\...\....\....\...\.........\...........\PageReader.java
.......................\...\....\....\...\.........\...........\Patterns.java
.......................\...\....\....\...\.........\...........\Readability.java
.......................\...\....\....\...\.........\...........\ReadabilityDriver.java
.......................\...\....\....\...\.........\...........\TikaCharsetDetector.java
.......................\...\....\....\...\.........\...........\XmlDataMap.java