资源列表
[搜索引擎] SharpICTCLAS
说明:ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct<ounata> 在 2024-11-13 上传 | 大小:1.87mb | 下载:0
[搜索引擎] CSharpSpider
说明:c# 蜘蛛程序 搜索引擎开发参考~~可以下载网站资源-c# Search engine spider programs can be downloaded for reference ~ ~ Web resources<me> 在 2024-11-13 上传 | 大小:28kb | 下载:0
[搜索引擎] Modeling_the_Internets
说明:David Hand (Imperial College, UK) 评价这本书说:这本书太迷人了! 值得一看-"This book is fascinating!"- David Hand (Imperial College, UK)<吴春> 在 2024-11-13 上传 | 大小:1.56mb | 下载:0
[搜索引擎] Lucene_in_Action
说明:lucene in action的中文版,但不是完全版,只是部分翻译,可以稍微看看。-lucene in action in the Chinese version, but not the full version, only part of the translation, you can see a little bit.<吴春> 在 2024-11-13 上传 | 大小:255kb | 下载:0
[搜索引擎] Lucene_in_Action_2nd_Edition
说明:lucene in action的第二版,比较新,是英文原版的,对学习lucene的初学者很有帮助。-lucene in action in the second edition, is relatively new, the English version, useful for beginners learning lucene.<吴春> 在 2024-11-13 上传 | 大小:3.21mb | 下载:0
[搜索引擎] GB9706_1_2007
说明:这是 GB 9706.1-2007 医用电气设备第1部分 安全通用要求(报批稿),能进行搜索查找的,非常方便-GB 9706.1<冰舟> 在 2024-11-13 上传 | 大小:951kb | 下载:0
[搜索引擎] Page98PageRank
说明:google PageRank算法详解,Google两位创始人在美国申请了PageRank的专利,这是他们对PageRank算法所发表的论文-Google PageRank Algorithm,PageRank Pattern<wang> 在 2024-11-13 上传 | 大小:186kb | 下载:0
[搜索引擎] ModernInformationRetrieval
说明:Google写的,信息检索方面的文章非常好-verygood,perfect,and you love it<ABC> 在 2024-11-13 上传 | 大小:65kb | 下载:0
[搜索引擎] hibase-0.1.0.tar
说明:一个使用的搜索引擎例子,可以在linux下运行-One example of the use of search engine, you can run linux<lvcheng> 在 2024-11-13 上传 | 大小:169kb | 下载:0