资源列表
[中文信息处理] TestClassBySVM
说明:支持向量机实现的文本分类程序,过程如下,首先使用分词工具分词,这里使用的是计算所的分词工具,从而保证分词是最优秀的,接下来使用国际效率最高的文本IFIDF向量生成工具生成文本相量,最后使用台湾林智恒的效率最高的SVM实现软件包libsvm实现训练和分类,可以这么说,该文本分类是同类中效率最高最准确的-text classfication source code use 3 technology.words sementation,vec<111111> 在 2024-06-08 上传 | 大小:18636800 | 下载:0
[中文信息处理] icu4c-4_4_1-src
说明:ICU是多国语言处理最权威的跨平台跨语言开发包,涉及多语种处理的方方面面。也是Unicode组织官方推荐的开发包。Java底层的多语言处理就是采用ICU4j。因为Java内核已经集成进去了,Java程序员可以在这方面少花许多脑筋。 一句话,如果用C++处理文本编码问题,ICU4c是不二之选。-ICU was originally developed by the Taligent company. The Taligent team<zhengyi> 在 2024-06-08 上传 | 大小:17360896 | 下载:0
[中文信息处理] icu4c-4_8_1_1-src
说明:IBM mul launge surport for hindi arribic ,chinese ,ganpanese<马昌健> 在 2024-06-08 上传 | 大小:19813376 | 下载:0
[中文信息处理] svmcls1214
说明:自己修改的svmcls 可以使用自定义的词库-The modify svmcls can use custom thesaurus<董帅> 在 2024-06-08 上传 | 大小:20525056 | 下载:0
[中文信息处理] novena_pvt2
说明:Novena open source laptop schematics and design files<bushing> 在 2024-06-08 上传 | 大小:18548736 | 下载:0
[中文信息处理] acopost_note
说明:acopost是Ingo Schroder于02年在德国汉堡大学完成的一个词性标注工具包。主要实现了基于实例、最大熵、2元隐马、基于转换规则等4种词性标注算法,以及评价和算法融合等。采用的语言是perl和c,代码比较短小,非常适于学习。-acopost Ingo Schroder is a speech in 2002 at the University of Hamburg, Germany marked the completion<wangxin> 在 2024-06-08 上传 | 大小:18686976 | 下载:0
[中文信息处理] HanLP-1.2.10.tar
说明:汉语自然语言处理,包括分词,词性标注,命名实体,及句法依存-chinese netrual solve<pengming> 在 2024-06-08 上传 | 大小:21683200 | 下载:0