搜索资源列表
语料库
- 一份很重要的语料库,为你的分词程序是一个很好用的资料库文件-a very important corpus, as your segmentation procedure is a very good use of the database file
复件 语料库试验程序
- 处理语料库信息的小程序-Corpus information handling procedures small
分词语料库
- 文本分词\分类的语料库
复件 语料库试验程序
- 处理语料库信息的小程序-Corpus information handling procedures small
quanwenjiansuo
- 全文检索程序,最长匹配,可以立刻找到所有出现的句子,需要语料库,(例如人民日报)。-text retrieval procedures, the longest match, can immediately find all the sentences need to Corpus (for example, the People's Daily).
liqingyun_paper
- 一篇关于“现代汉语标注语料,树库文档转换成XML文档”的论文。 论文主要做了以下三个工作: 1. 对于汉语语料库的文本文档,进行转换,生成XML文档。 2. 对于符合树库标准的文档,进行转换,生成XML文档。 3. 将XML文档,根据DOM标准,以树形显示在屏幕上。-one of the "Modern Chinese Corpus tagging trees for documents converted into XML
TestCorpus
- 这个对vc的初学者很有帮助哦,简单的语料库管理工具。-the right vc beginners helpful Oh, the simple Corpus management tool.
语音合成语料库管理系统的研究与设计
- 本文主要叙述了语料及其管理系统的研究与设计用最新的开发工具和现有软件达到系统的设计 目标-This paper describes the corpus and its management system research and design using the latest development tools and existing software system to achieve the design goal
v.206(预处理)
- lex语法分析,对BNC语料库进行文本标注前的预处理,将与SGML标注与文本词性标注无关的删除掉-this is lex syntax analyzing,annotate with BNC syntax LIB.
语料库
- 一份很重要的语料库,为你的分词程序是一个很好用的资料库文件-a very important corpus, as your segmentation procedure is a very good use of the database file
CJCorpus
- 一个日汉平行的双语语料库,含有4053个句子-a parallel to the Japanese and Chinese bilingual corpus, containing 4,053 Sentence
wenbenfenlei
- 中文文本分类的语料库,比较全面,可用于进行分类训练时-Chinese text classification of Corpus, more comprehensive, and can be used for classification of training
CorpusDemo.exe
- 这是一个语料库查询系统,可以学习一下VC的文件操作和管理平台建设-This is a Corpus inquiry system, we can learn from what the VC operation and document management platform
Qwickconcordance-1.0
- 这是一个语料库检索的程序,可以学习一下CONCORDANCE以及它的实现-This is a Corpus retrieval procedures can learn about CONCORDANCE and its realization
TestCorpusyuliaoguanli
- 1. 这是一个简单的语料库管理系统 2. 可以添加和删除语料文件,统计语料中的字数 3. 可以查找语料中的汉字串以及重叠形式 4. 语料文件存放在corpus目录下,查询结果保存在跟语料库相同目录下 5. corpus目录下有4个文本文件(其中test1, test2是两个小文件)供测试用 6. 只能处理文本文件,GB内码-1. This is a simple Corpus management system 2.
tongyc
- 自然语言信息处理的语料库,非常好的测试语料-natural language information processing Corpus, very good testing corpus
jiyusimfenlei
- 基于SVM的文档分类,运行平台:Visual C++ 6.0和基于libsvm的编程环境下,应用Reuters-21578语料库对系统进行评测。-SVM-based document classification, operating platforms : 6.0 and Visual C libsvm-based programming environment, Application Reuters-21578 Corpus ev
Wordsegmentation2
- NLP技术实现,对语料库进行自动统计生成分词词典,对训练集进行分词,列出所有的分词可能并计算每种可能的概率。请使用者自行加入语料库和测试集。-NLP technology to automatically Corpus Health Statistics ingredients dictionary, the training set for segmentation, list all the sub-term may calcula
SogouW.20061127
- 互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。 语料库统计的意义:反映了互联网中文语言环境中的词频、词性情况。 应用案例:中文词性标注、词频分析等。 词性分类: N 名词 V 动词 ADJ 形容词 A
语料库检索工具
- 一个语料库检索工具,可以对文本形式的英汉词典(包含常用英文词汇)进行检索,是开发大型语料库工具的原型(the assistance of statistical package and computer programs)