搜索资源列表

  1. ictclas_Source_Code

    0下载:
  2. 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:110.58kb
    • 提供者:郑昀
  1. firtex_beta102_src

    0下载:
  2. FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(10
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:13.16mb
    • 提供者:阮正
  1. FreeICTCLAS

    1下载:
  2. 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:2.95mb
    • 提供者:xuli
  1. 网页搜索引擎

    0下载:
  2. K-PageSearch是由Kwindsoft在2007年自主研发的专为行业、专类信息检索设计的网页搜索引擎。主要功能特点:网络蜘蛛、定向采集、正文提取、中文分词、全文索引、相关度排序、网页快照、相关搜索、竞价排名;后台数据库采用Microsoft SQL Server,静态化搜索系统设计采用XML数据岛缓存搜索结果提高系统的稳定性和性能、节省服务器资源减轻系统负担。 网络蜘蛛 K风蜘蛛组件包括三大功能模块:链接采集、网页分析、无效网页
  3. 所属分类:ASP源码

    • 发布日期:2011-04-14
    • 文件大小:699.78kb
    • 提供者:gongcolin
  1. ictclas_Source_Code

    0下载:
  2. 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的
  3. 所属分类:中文信息处理

    • 发布日期:2024-11-24
    • 文件大小:110kb
    • 提供者:郑昀
  1. firtex_beta102_src

    0下载:
  2. FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(10
  3. 所属分类:搜索引擎

    • 发布日期:2024-11-24
    • 文件大小:13.31mb
    • 提供者:阮正
  1. FreeICTCLAS

    0下载:
  2. 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。 -Chinese Academy of Sciences of the Chinese lexical analysis system ICTCLAS, main functions, including Chinese word segmentation-of-speech tagging Named Entit
  3. 所属分类:中文信息处理

    • 发布日期:2024-11-24
    • 文件大小:2.95mb
    • 提供者:xuli
  1. ICTCLAS2009

    0下载:
  2. 对中文进行分词并对其词性标注;命名实体识别;新词识别;同时支持用户词典-To be conducted in Chinese word segmentation and POS tagging Named Entity Recognition new word identification simultaneously support the user dictionary
  3. 所属分类:软件工程

    • 发布日期:2024-11-24
    • 文件大小:54kb
    • 提供者:ictclas
  1. FreeICTCLAS

    0下载:
  2. 汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格
  3. 所属分类:其他小程序

    • 发布日期:2024-11-24
    • 文件大小:4.23mb
    • 提供者:lwl
  1. windowsC32

    0下载:
  2. 汉语词法分词系统,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。-Morphology of Chinese word segmentation systems, the main features include Chinese word segmentation-of-speech tagging named entity recognition new word identification At
  3. 所属分类:Windows编程

    • 发布日期:2024-11-24
    • 文件大小:9.67mb
    • 提供者:panda
  1. SharpICTCLAS

    0下载:
  2. ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct
  3. 所属分类:搜索引擎

    • 发布日期:2024-11-24
    • 文件大小:1.87mb
    • 提供者:ounata
  1. windows_csharp_32

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。ICTCLAS全部采用C/C++编写,支持Linux、FreeBSD及Windows系列操作系统,
  3. 所属分类:C#编程

    • 发布日期:2024-11-24
    • 文件大小:6.21mb
    • 提供者:火山
  1. ChineseWordSegmentation1

    0下载:
  2. 中文分词-前向最大匹配方法;VS2008环境下实现-Chinese word- the former to the maximum matching method VS2008 environment to achieve
  3. 所属分类:中文信息处理

    • 发布日期:2024-11-24
    • 文件大小:916kb
    • 提供者:孙伟
  1. ICTCLAS2010CSharpDemo

    0下载:
  2. 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICT
  3. 所属分类:搜索引擎

    • 发布日期:2024-11-24
    • 文件大小:91kb
    • 提供者:Liuying
  1. VC2010

    0下载:
  2. VC调用中科院分词2010版组件的最新源码! 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级8次,目前已经升级到了ICTCLAS2010!-VC
  3. 所属分类:编译器/词法分析

    • 发布日期:2024-11-24
    • 文件大小:6.89mb
    • 提供者:胡名
  1. windows_c_32

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词
  3. 所属分类:编译器/词法分析

    • 发布日期:2024-11-24
    • 文件大小:9.86mb
    • 提供者:陈蓉
  1. sse4j

    0下载:
  2. SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用接口 3)SSE4J工具集 规划的SSE4J包含的功能: 1) POI搜索(名称、地址、类型等关键字搜索;周
  3. 所属分类:JSP源码/Java

    • 发布日期:2024-11-24
    • 文件大小:473kb
    • 提供者:dux
  1. ICTCLAS

    0下载:
  2. 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009。-Institute of Computing Technol
  3. 所属分类:其他小程序

    • 发布日期:2024-11-24
    • 文件大小:4.24mb
    • 提供者:huyunfei
  1. chinese_seg_update

    0下载:
  2. 中文分词,采用逆向最大匹配方法实现,利用字典作为索引(The Chinese word segmentation is realized by the reverse maximum matching method, and the dictionary is used as the index.)
  3. 所属分类:其他小程序

    • 发布日期:2024-11-24
    • 文件大小:1.51mb
    • 提供者:meizu
  1. icwb2-data

    0下载:
  2. 中文分词数据,含有as、 cityu、msr、pku数据,包括测试集、训练集(Chinese word segmentation data)
  3. 所属分类:文档资料

    • 发布日期:2024-11-24
    • 文件大小:45.81mb
    • 提供者:万俟洛
« 12 »

源码中国 www.ymcn.org