资源列表
[中文信息处理] seadog-installer
说明:对于垂直搜索引擎来说,网络蜘蛛是非常重要的,因为在垂直搜索领域,数据的收集工作都是由蜘蛛程序来完成的。垂直搜索引擎除了要设计蜘蛛程序外,还要管理这些蜘蛛程序的运行,这是比较复杂的工作。如果缺乏一套有效的管手段,那么垂直搜索引擎将面临一场恶梦。 然而幸运的是,我们有了海蛛--这个领先的垂直搜索专用网络蜘蛛系统。有了海蛛,垂直搜索更简单!使用了海蛛,一切变得有条不紊,变得简单起来。 -The vertical search<峰云> 在 2025-02-06 上传 | 大小:16.02mb | 下载:0
[中文信息处理] TestClassBySVM
说明:支持向量机实现的文本分类程序,过程如下,首先使用分词工具分词,这里使用的是计算所的分词工具,从而保证分词是最优秀的,接下来使用国际效率最高的文本IFIDF向量生成工具生成文本相量,最后使用台湾林智恒的效率最高的SVM实现软件包libsvm实现训练和分类,可以这么说,该文本分类是同类中效率最高最准确的-text classfication source code use 3 technology.words sementation,vec<111111> 在 2025-02-06 上传 | 大小:17.77mb | 下载:0
[中文信息处理] ChiToLetter
说明:汉字转拼音,解决了多音节字的问题,并且在unicode模式下编译-。在unicode下调试成功-Chinese characters to Pinyin, solved the problem of multi-syllable word, and in unicode mode compiler<yuancan> 在 2025-02-06 上传 | 大小:14.47mb | 下载:0
[中文信息处理] icu4c-4_4_1-src
说明:ICU是多国语言处理最权威的跨平台跨语言开发包,涉及多语种处理的方方面面。也是Unicode组织官方推荐的开发包。Java底层的多语言处理就是采用ICU4j。因为Java内核已经集成进去了,Java程序员可以在这方面少花许多脑筋。 一句话,如果用C++处理文本编码问题,ICU4c是不二之选。-ICU was originally developed by the Taligent company. The Taligent team<zhengyi> 在 2025-02-06 上传 | 大小:16.56mb | 下载:0
[中文信息处理] KDD_Project_39
说明:这是一个关于文字处理的软件。 应有的处理部分都有了。 请注意使用-this is a software for text clustering<pi> 在 2025-02-06 上传 | 大小:14.7mb | 下载:0
[中文信息处理] novena_pvt2
说明:Novena open source laptop schematics and design files<bushing> 在 2025-02-06 上传 | 大小:17.69mb | 下载:0
[中文信息处理] Programming-WPF--source
说明:Programming WPF source Programming WPF-Programming WPF source Programming WPF<kens> 在 2025-02-06 上传 | 大小:15.77mb | 下载:0
[中文信息处理] acopost_note
说明:acopost是Ingo Schroder于02年在德国汉堡大学完成的一个词性标注工具包。主要实现了基于实例、最大熵、2元隐马、基于转换规则等4种词性标注算法,以及评价和算法融合等。采用的语言是perl和c,代码比较短小,非常适于学习。-acopost Ingo Schroder is a speech in 2002 at the University of Hamburg, Germany marked the completion<wangxin> 在 2025-02-06 上传 | 大小:17.82mb | 下载:0
[中文信息处理] QEMU-based framework, sources
说明:LuaQEMU is a QEMU-based fr a mework exposing several of QEMU-internal APIs to a LuaJIT core injected into QEMU itself.<SergeXY1> 在 2022-01-30 上传 | 大小:15.37mb | 下载:0