资源列表
[搜索引擎] CourseCrawler_1_0_0_final
说明:搜索专业术语的爬虫,指定专业网站的列表从中搜索专业术语相关的网页。-search of the reptile's terms, the designated professional websites from the list of search terms related to the professional website.<匿名> 在 2008-10-13 上传 | 大小:379.81kb | 下载:0
[搜索引擎] clucene_src_for_chinese
说明:汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了。1.在vc 6编译 2.还不支持分词,但支持汉字,要索引的文本词与词之间用空格隔开。3.只是匆匆改了一下,见demo/IndexFiles.cpp,有问题可以与我联系。有空时改完善些。 -finished CLucene today, CLucene procedures changed a bit in support of the Chinese<lucence12> 在 2024-11-13 上传 | 大小:392kb | 下载:0
[搜索引擎] CourseCrawler_1_0_0_final
说明:搜索专业术语的爬虫,指定专业网站的列表从中搜索专业术语相关的网页。-search of the reptile's terms, the designated professional websites from the list of search terms related to the professional website.<匿名> 在 2024-11-13 上传 | 大小:379kb | 下载:0
[搜索引擎] TDHCursorFactory
说明:是一个使用Perl语言编写的一个开源文本挖掘的程序。其中涉及了众多文本挖掘的技术,如文本聚类、分词、索引,搜索引擎、字典等等。-Perl is a language to use an open source text mining process. Involving a large number of text mining technologies, such as text clustering, segmentation, i<wy> 在 2024-11-13 上传 | 大小:386kb | 下载:0
[搜索引擎] zhuomiansousuoyinqing
说明:桌面搜索引擎用于搜索本机硬盘内各文件或者文件夹,并输出结果。-Desktop search engine used to search the hard drive of each file or folder, and output.<伊瓦> 在 2024-11-13 上传 | 大小:392kb | 下载:0
[搜索引擎] sphinx-egypt-2007
说明:sphinx-egypt-2007开源搜索引擎-sphinx-egypt-2007 open-source search engine<王文学> 在 2024-11-13 上传 | 大小:394kb | 下载:0
[搜索引擎] p-0422--Simple_Search_Engine
说明:a simple search engine<tank> 在 2024-11-13 上传 | 大小:385kb | 下载:0
[搜索引擎] NWebCrawler
说明:网络爬虫, * 可配置:线程数、线程等待时间,连接超时时间,可爬取文件类型和优先级、下载目录等。 * 状态栏显示统计信息:排入队列URL数,已下载文件数,已下载总字节数,CPU使用率和可用内存等。 * 有偏好的爬虫:可针对爬取的资源类型设置不同的优先级。 * 健壮性:十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。 * 较好的性能:基于正则表达式的页面解析、适度加锁、维持H<wu> 在 2024-11-13 上传 | 大小:378kb | 下载:0