搜索资源 - 中文语料库 - 源码中国

源码中国

注册会员 | 设为首页 | 加入收藏夹 | English Version

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 游戏源码更多...

登陆 | 会员注册

当前位置：

搜索资源 - 中文语料库

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

搜索资源列表

wenbenfenlei

0下载：
中文文本分类的语料库，比较全面，可用于进行分类训练时-Chinese text classification of Corpus, more comprehensive, and can be used for classification of training
所属分类：其它资源
- 发布日期：2008-10-13
- 文件大小：3.65mb
- 提供者：齐明

SogouW.20061127

0下载：
互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析，统计所进行的时间是2006年10月，涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词，除标出这部分词条的词频信息之外，还标出了常用的词性信息。语料库统计的意义：反映了互联网中文语言环境中的词频、词性情况。应用案例：中文词性标注、词频分析等。词性分类: N 名词 V 动词 ADJ 形容词 A
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：1.2mb
- 提供者：17521

wenbenfenlei

0下载：
中文文本分类的语料库，比较全面，可用于进行分类训练时-Chinese text classification of Corpus, more comprehensive, and can be used for classification of training
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2024-11-23
- 文件大小：3.65mb
- 提供者：齐明

SogouW.20061127

0下载：
互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析，统计所进行的时间是2006年10月，涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词，除标出这部分词条的词频信息之外，还标出了常用的词性信息。语料库统计的意义：反映了互联网中文语言环境中的词频、词性情况。应用案例：中文词性标注、词频分析等。词性分类: N 名词 V 动词 ADJ 形容词 A
所属分类：搜索引擎
- 发布日期：2024-11-23
- 文件大小：1.2mb
- 提供者：17521

tf-idf(chinese)

0下载：
ti－idf算法，实现对中文文档的检索，把多篇文档中的词，按照权值从小到大进行排列（词语以文本中的词库为准）-ti-idf algorithm, the realization of the Chinese document retrieval, to document more than words, in accordance with the right values from small to large to carry ou
所属分类：中文信息处理
- 发布日期：2024-11-23
- 文件大小：633kb
- 提供者：min

chinese

0下载：
中文信息处理基础第一讲VC环境编程简介第二讲文件处理第三讲字符编码第四讲字频统计第五讲文本断句第六讲语料库-Basic information first deal with English-speaking environment for programming VC brief introduction stresses the second file handle character encod
所属分类：编译器/词法分析
- 发布日期：2024-11-23
- 文件大小：36.68mb
- 提供者：李明

AutoChatting

1下载：
用AIML语言开发的一款中文自动聊天软件，附加有部分AIML中文对话语料库-AIML language developed by a Chinese auto-chat software, additional dialogue, some Chinese Corpus AIML
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2024-11-23
- 文件大小：1.19mb
- 提供者：易顺明

PFR199801

0下载：
PFR人民日报标注语料，它是中文信息处理的重要训练样本-PFR marked the People' s Daily corpus, which is an important Chinese information processing training samples
所属分类：中文信息处理
- 发布日期：2024-11-23
- 文件大小：2.12mb
- 提供者：weiwei

BootCaT-0.1.2.tar

0下载：
此软件是开源软件，主要用于中文信息处理，信息检索。本人主要用于网络获取双语语料库。此软件用perl编写，模块独立性强，在获得收集一些种子网址后，即可用于双语网络获取。-The perl scr ipts included in the BootCaT toolkit implement an iterative procedure to bootstrap specialized corpora and terms from t
所属分类：WEB源码
- 发布日期：2024-11-23
- 文件大小：50kb
- 提供者：liwen

Chinese--NER

0下载：
基于CRF的中文机构名识别系统。使用北京大学1998年的人民日报语料库作为训练语料。除常用的特征模板，已经词性特征外，使用词语的最后一个字作为特征，提高了机构名识别的准确率, 调用了CRF++程序包训练模型。-CRF-based name recognition system of Chinese institutions. People' s Daily, Peking University in 1998 with corpu
所属分类：语音合成与识别
- 发布日期：2024-11-23
- 文件大小：26kb
- 提供者：paul

WekaTest

0下载：
weka包+eclipse完成中文语料库分词分类-weka package+ eclipse complete classification of Chinese word segmentation corpus
所属分类：其他小程序
- 发布日期：2024-11-23
- 文件大小：10.97mb
- 提供者：陈蓉

qwvvfg

0下载：
基于语料库的中文姓名识别方法研究本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率，研究了中文姓名识别的评价函数，动态地建立了姓名识别统计数据表和姓名阅值-Corpus-based Study of Chinese Names Recognition Based on the large-scale extraction and analysis of corpus based on the first and
所属分类：图形/文字识别
- 发布日期：2024-11-23
- 文件大小：274kb
- 提供者：张驰

PoS-Tagging-based-on-HMM

0下载：
基于隐马尔科夫的中文词性标注系统的C++源代码，包括训练集和测试集语料库，单词量和词性数目都没有写死，可适应任意大的训练和测试数据集，程序已经过优化，一次标注只需要不到10秒的时间。-Based on Hidden Markov of the Chinese part of speech tagging system in C++ source code, including the training set and test set
所属分类：Windows编程
- 发布日期：2024-11-23
- 文件大小：4.23mb
- 提供者：蒋智威

master_thesis

0下载：
音乐领域中文实体关系抽取研究实体关系抽取的任务是从文本中抽取出两个或者多个实体之间预先定义好的语义关系。本文将实体关系抽取定义为一个分类问题，主要研究内容是中文音乐领域的实体关系抽取。针对这一问题，本文首先构建了中文音乐实体关系语料库，然后分别采用了基于序列模式挖掘的无指导的方法和基于特征提取的有指导的方法来解决这一问题。 -Dissertation for the Master Degree in Eng
所属分类：行业发展研究
- 发布日期：2024-11-23
- 文件大小：1.38mb
- 提供者：xz

pfr199801

1下载：
PFR人民日报标注语料库(版本1.0，下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下，以1998年人民日报语料为对象，由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展，我们三方计划公开PFR语料库。作为公开的前期工作，从4月3日起，在我们三方的主页上免费公开PFR语料库1月份的语料，欢迎大家下载。PFR语料库的制作规范参阅《现代汉语语料库加工――词语切分与词性标
所属分类：中文信息处理
- 发布日期：2024-11-23
- 文件大小：2.11mb
- 提供者：icypriest

fenci

0下载：
利用HMM，针对《1998年人民日报》语料库进行研究，最终实现了中文语句的自动分词-By HMM, research, and ultimately the Chinese statement for the 1998 People' s Daily " Corpus automatic segmentation
所属分类：C#编程
- 发布日期：2024-11-23
- 文件大小：4.03mb
- 提供者：txd

hownet

1下载：
知网完整版，附带相关的各种论文文档,中文语料库-see chinese descr iption
所属分类：软件工程
- 发布日期：2024-11-23
- 文件大小：17.3mb
- 提供者：smith

chinese_text_classification-master

0下载：
文本分类的一个基本项目，用到的是复旦大学中文语料库(a basic project for text classification,I use the corpus from fudan university as my training and testing corpus)
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2024-11-23
- 文件大小：12.14mb
- 提供者：dsldsl

icwb2-data

0下载：
NLP中文语料库，backoff语料库，可以用来训练(A wiki (Listeni/ˈ wɪ ki/ WIK-ee) is a website that provides collaborative modification of its content and structure directly the web browser. In a typical wiki, text is written using a
所属分类：matlab例程
- 发布日期：2024-11-23
- 文件大小：40.82mb
- 提供者：`casdfsf

BosoNnlp

0下载：
玻森专注中文语义分析技术，拥有丰富的经验积累。自主研发千万级中文语料库，为精准和深度的中文语义分析提供坚实基础。一站式解决您的中文语义分析需求。多个语义分析API，从情感倾向、实体、分类等方面。官网只有python版本，现上传Java的实例。(He focuses on Chinese semantic analysis technology and has rich experience. Independently developi
所属分类：Windows编程
- 发布日期：2024-11-23
- 文件大小：8.63mb
- 提供者：hhitkyA

« 12 »

源码中国 www.ymcn.org

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　沪ICP备09016508号

1999-2046 源码中国 All Rights Reserved.