资源列表
[搜索引擎] heritrix-1.14.0-src
说明:知名网络蜘蛛源码,可以下载整站内容,扩展性强,可以下载动态网页<zhang> 在 2024-11-13 上传 | 大小:9.7mb | 下载:1
[搜索引擎] SearchEngine
说明:1.这是一个简单的采用了Lucene的搜索引擎,本例子采用lucene+struts+ibatis的框架进行开发,使用的数据库是Oracle,搜索源是jpetstore的product表,大家在使用的时候请根据实际情况修改database.properties文件的配置。 2.本例子支持中文搜索,相关的源码包在cnSolution目录。 -1. This is a simple use of the Lucene search<xiaweicong> 在 2024-11-13 上传 | 大小:1.8mb | 下载:0
[搜索引擎] BaiduMusicBox
说明:本程序将完成搜索baidu,的结果进行处理,,来完成音乐的搜索与播放的功能-This procedure will be completed search baidu, the results of treatment, to complete the music search and playback function<祝德红> 在 2024-11-13 上传 | 大小:242kb | 下载:0
[搜索引擎] WebNewsCrawler-1.0
说明:垂直搜索的网络爬虫,收集新闻信息的爬虫,采用java编写,附带源代码-Vertical search network reptiles, reptiles to collect news and information, using java to prepare, with the source code<c4pt0r> 在 2024-11-13 上传 | 大小:5.5mb | 下载:0
[搜索引擎] ICTCLAS_aoyun_windows_c_32
说明:中科院分词系统CTCLAS_aoyun_windows_c_32-Chinese Academy of Sciences CTCLAS_aoyun_windows_c_32 Word Segmentation System<李强> 在 2024-11-13 上传 | 大小:2.19mb | 下载:0
[搜索引擎] HowtouseOpenLayers
说明:介绍了如何使用OpenLayers的方法-Introduce how to use the method of OpenLayers<jason> 在 2024-11-13 上传 | 大小:5kb | 下载:0
[搜索引擎] search_engine
说明:搜索引擎 控件内置多线程下载. 内置html完全解释.(解释了90%左右html脚本, 容错控制采用仿ie的技术) 内置javascrip有限解释.(解释了基本循环, 字符操作运算和整型运算) 内置正文分析的分解.(只仅中文简体) 后三项可以关掉, 采用第三方技术.-Search engine built-control multi-threaded download. Built-html fully explai<he> 在 2024-11-13 上传 | 大小:91kb | 下载:0
[搜索引擎] PersonalSerachEngineer
说明:就当前搜索引擎存在滞后性、缺乏个性化的问题给出了一种实时的、个性化的搜索引擎 的Personal IntelligentSearchEngine (PISE)爬虫算法。PISE可以实时地返回给用户查询结果,爬行虫根据用户输入的关键字直接到网上搜寻与之相关的信息,保证将最新结果返回给用户。爬虫算法通过一定的初始策略,运用使爬虫的搜索精益求精的思想,达到与用户的需求逐步接近的目的,从而实现搜索的智能化。实验证明PISE能够实现这一功能。<李强> 在 2024-11-13 上传 | 大小:258kb | 下载:0