资源列表
[搜索引擎] webCrawler
说明:一种高性能分布式W eb Craw ler 的设计与实现-A high-performance distributed W eb Craw ler Design and Implementation<贾晓绒> 在 2025-01-11 上传 | 大小:41kb | 下载:0
[搜索引擎] 33753115ktdictseg_v1.0.01
说明:中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数-It s an arithmetc of word segment,it has a very high efficiency!<郭刚> 在 2025-01-11 上传 | 大小:37kb | 下载:0
[搜索引擎] search_for_substring
说明:此程序用于搜索从ES:1000开始的长度为100H的区域,是否存在给定的子字符串,其中,子字符串存放在以DS:1100开始的区域中,分别用DI,SI,指向它们。如果搜索到,在DS:1111处填写44(“是”的谐音),找不到,则填写55(“无”的谐音)。在本程序中,DS与ES相同。在本程序中,我们假设要搜索的子字符串的长度为3,字符可以自行设定。当然,可以改变BX来改变搜索的子字符串的长度-This program used to sea<yangxiao> 在 2025-01-11 上传 | 大小:58kb | 下载:0
[搜索引擎] SharpICTCLAS
说明:ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct<ounata> 在 2025-01-11 上传 | 大小:1.87mb | 下载:0
[搜索引擎] CSharpSpider
说明:c# 蜘蛛程序 搜索引擎开发参考~~可以下载网站资源-c# Search engine spider programs can be downloaded for reference ~ ~ Web resources<me> 在 2025-01-11 上传 | 大小:28kb | 下载:0