搜索资源列表

  1. ictclas_Source_Code

    0下载:
  2. 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:110.58kb
    • 提供者:郑昀
  1. firtex_beta102_src

    0下载:
  2. FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(10
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:13.16mb
    • 提供者:阮正
  1. FreeICTCLAS

    1下载:
  2. 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:2.95mb
    • 提供者:xuli
  1. ictclas_Source_Code

    0下载:
  2. 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的
  3. 所属分类:中文信息处理

    • 发布日期:2024-11-30
    • 文件大小:110kb
    • 提供者:郑昀
  1. firtex_beta102_src

    0下载:
  2. FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(10
  3. 所属分类:搜索引擎

    • 发布日期:2024-11-30
    • 文件大小:13.31mb
    • 提供者:阮正
  1. FreeICTCLAS

    0下载:
  2. 中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。 -Chinese Academy of Sciences of the Chinese lexical analysis system ICTCLAS, main functions, including Chinese word segmentation-of-speech tagging Named Entit
  3. 所属分类:中文信息处理

    • 发布日期:2024-11-30
    • 文件大小:2.95mb
    • 提供者:xuli
  1. ICTCLAS2009

    0下载:
  2. 对中文进行分词并对其词性标注;命名实体识别;新词识别;同时支持用户词典-To be conducted in Chinese word segmentation and POS tagging Named Entity Recognition new word identification simultaneously support the user dictionary
  3. 所属分类:软件工程

    • 发布日期:2024-11-30
    • 文件大小:54kb
    • 提供者:ictclas
  1. FreeICTCLAS

    0下载:
  2. 汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格
  3. 所属分类:其他小程序

    • 发布日期:2024-11-30
    • 文件大小:4.23mb
    • 提供者:lwl
  1. windowsC32

    0下载:
  2. 汉语词法分词系统,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。-Morphology of Chinese word segmentation systems, the main features include Chinese word segmentation-of-speech tagging named entity recognition new word identification At
  3. 所属分类:Windows编程

    • 发布日期:2024-11-30
    • 文件大小:9.67mb
    • 提供者:panda
  1. Bayes_1

    0下载:
  2. 首先,对CATEGORY中的txt文件分类; 其次,对多个txt文件中的英文文本进行分词; 最后,通过贝叶斯公式进行分类;-First, in the txt file CATEGORY classification Secondly, multiple txt files in English text word Finally, by Bayes formula to be classified
  3. 所属分类:数学计算/工程计算

    • 发布日期:2024-11-30
    • 文件大小:402kb
    • 提供者:guangyu
  1. WordFrequencyStatistics

    0下载:
  2. 字频统计,根据词库 实现汉字分词,效果不错; 另外还能够统计出汉字词出现的频率;-Word frequency statistics, according to Chinese characters thesaurus, word, In addition to the Chinese characters of statistics.
  3. 所属分类:C#编程

    • 发布日期:2024-11-30
    • 文件大小:235kb
    • 提供者:zhu clay
  1. SharpICTCLAS

    0下载:
  2. ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct
  3. 所属分类:搜索引擎

    • 发布日期:2024-11-30
    • 文件大小:1.87mb
    • 提供者:ounata
  1. windows_csharp_32

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。ICTCLAS全部采用C/C++编写,支持Linux、FreeBSD及Windows系列操作系统,
  3. 所属分类:C#编程

    • 发布日期:2024-11-30
    • 文件大小:6.21mb
    • 提供者:火山
  1. ICTCLAS2010CSharpDemo

    0下载:
  2. 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICT
  3. 所属分类:搜索引擎

    • 发布日期:2024-11-30
    • 文件大小:91kb
    • 提供者:Liuying
  1. VC2010

    0下载:
  2. VC调用中科院分词2010版组件的最新源码! 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级8次,目前已经升级到了ICTCLAS2010!-VC
  3. 所属分类:编译器/词法分析

    • 发布日期:2024-11-30
    • 文件大小:6.89mb
    • 提供者:胡名
  1. windows_c_32

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词
  3. 所属分类:编译器/词法分析

    • 发布日期:2024-11-30
    • 文件大小:9.86mb
    • 提供者:陈蓉
  1. ICTCLAS

    0下载:
  2. 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009。-Institute of Computing Technol
  3. 所属分类:其他小程序

    • 发布日期:2024-11-30
    • 文件大小:4.24mb
    • 提供者:huyunfei
  1. ICTCLAS50_Windows_64_C

    0下载:
  2. 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制了汉语词法分析系统ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典;支持繁体中文;支持gb2312、GBK、UTF8等多种编码格式。 ICTCLAS分词速度单机500KB
  3. 所属分类:编译器/词法分析

    • 发布日期:2024-11-30
    • 文件大小:8.81mb
    • 提供者:huangfei
  1. chinese_seg_update

    0下载:
  2. 中文分词,采用逆向最大匹配方法实现,利用字典作为索引(The Chinese word segmentation is realized by the reverse maximum matching method, and the dictionary is used as the index.)
  3. 所属分类:其他小程序

    • 发布日期:2024-11-30
    • 文件大小:1.51mb
    • 提供者:meizu
  1. icwb2-data

    0下载:
  2. 中文分词数据,含有as、 cityu、msr、pku数据,包括测试集、训练集(Chinese word segmentation data)
  3. 所属分类:文档资料

    • 发布日期:2024-11-30
    • 文件大小:45.81mb
    • 提供者:万俟洛
« 12 3 »

源码中国 www.ymcn.org