搜索资源列表
htmlparser1.6
- htmlparser1.6,对HTML语言的解析,而且对每个标签都基本上有相应的解析类,非常不错.-htmlparser1.6 the HTML language parsing Each label but are basically a corresponding analytical categories, very good.
htmlcleaner2_1-all
- htmlcleaner能针对html进行文本解析,将其分解为tag元素,并生成相应的dom结构.由于遵循W3C规范,它能有效的清理html中不合法的部分,借助其Writer功能将一个非标准、不有效的html格式化为xhtml规格。事实上也不仅仅如此。-htmlcleaner can html text for analysis, tag will be broken down into its elements, and generat
jericho-html-3.0
- HTML解析器是一个Java库,以分析和操纵部分的HTML文件,其中包括服务器端的标签,任何无法识别的或无效的HTML。它也提供高层次的HTML表单操作函数。-Jericho HTML Parser is a Java library allowing analysis and manipulation of parts of an HTML document, including server-side tags, while rep
htmlparser.jar
- html文件内容解析,读取HTML文件内容元素。-html files
jsoup-1.4.1-sources
- 目前最好用的HTML解析库,支持完整的C-Currently the best use of HTML parsing library that supports the full CSS
jsoup-1.7.1-sources.jar
- jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。 jsoup的主要功能如下: 从一个URL,文件或字符串中解析HTML; 使用DOM或CSS选择器来查找、取出数据; 可操作HTML元素、属性、文本; jsoup是基于MIT协议发布的,可放心使用于商业
tika
- Apache tika 可以解析各种富文本格式的文件,得到其中的文本内容字符串。如tika 可用于解析Office 97/2003/2007 格式、PDF 格式、HTML 等格式的文件。请参考tika-app-1.5.jar 的功能,实现一个GUI 界面的桌面程序,该程序可以打开以上几种格式的文件,调用tika 进行解析,在界面上展示txt 解析结果,并将结果保存成文本文件。该程序也可以同时打开一组文件,以多线程的方式对它们进行并行处理
jsoup-1.7.2
- 该JAR在解析html文档的时候用到,使用简单,灵活性强(this jar sayalizae make easy and very good)