资源列表
[搜索引擎] gsearch-linux-src-1.0
说明:这是一款桌面文件搜索引擎,能够检索本地文件,速度非常快,索引1G文件只是需要一秒钟,能够运行在 Windows/Unix/Linux 等平台<黑夜路人> 在 2008-10-13 上传 | 大小:88.06kb | 下载:0
[搜索引擎] heritrix-2.0.0-src
说明:Heritrix: Internet Archive Web Crawler The archive-crawler project is building a flexible, extensible, robust, and scalable web crawler capable of fetching, archiving, and analyzing the full diversity and breadth of in<gaoquan> 在 2008-10-13 上传 | 大小:2.95mb | 下载:0
[搜索引擎] lucene-1.4-final-src
说明:搜索引擎的辕马 大家可以使用他 谢谢 欢迎大家的使用<liyun> 在 2008-10-13 上传 | 大小:960.42kb | 下载:0
[搜索引擎] heritrixProject
说明:搜索引擎的一个分支,在搜索网页时首先得用一个爬虫来获取网址该代码的功能就是获取所需网址的<fan> 在 2008-10-13 上传 | 大小:10.95mb | 下载:0
[搜索引擎] paoding-analysis-2.0.4-alpha2
说明:一款基于java的分词软件,用来把中文文章分成有意义的单词。<姓名> 在 2008-10-13 上传 | 大小:3.42mb | 下载:0
[搜索引擎] seo_1.3_600it
说明:Z:\\BoFut_搜索引挚源码分析\\01-SEO\\Google 搜索 引擎 算法 的 秘密.rar<mydown51> 在 2008-10-13 上传 | 大小:41.59kb | 下载:0
[搜索引擎] webharvest1-project
说明:Web-Harvest是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Web-Harvest主要是运用了像XSLT,XQuery,正则表达式等这些技术来实现对text/xml的操作<lori> 在 2008-10-13 上传 | 大小:5.89mb | 下载:0