搜索资源列表
FlexCRFs-0.3
- Hieu Xuan Phan & Minh Le Nguyen 利用CRF统计模型写的可用于英文命名实体识别、英文分词的工具(开放源码)。CRF模型最早由Lafferty提出,全名conditional random fields,该模型后来被广泛地应用在语言和图像处理领域,并随之出现了很多的变体。FlexCRF就是对CRF模型的一个实现应用工具,可用于文本信息处理
code1
- 我做了几个英文分词的程序,java实现的,这是第1个,共享给大家
code2
- 我做了几个英文分词的程序,java实现的,这是第2个,共享给大家
code3
- 我做了几个英文分词的程序,java实现的,这是第3个,共享给大家
code4
- 我做了几个英文分词的程序,java实现的,这是第4个,共享给大家
code5
- 我做了几个英文分词的程序,java实现的,这是第5个,共享给大家
lucene-1.4.3
- java分词技术,只实现英文分词,但是该分词算法很经典(来源于apache)-java-term technology, achieving only English Word, but the Word algorithm classic (from apache)
中文分词技术及最新发展
- 搜索引擎通常由信息收集和信息检索两部分组成。对于英文,由于英文中词 与词之间是用空格隔开,检索起来很方便,故计算机采用了词处理的方式,大大 减轻了用户与计算机的工作量:相对来讲,中文的情形就复杂得多。中文的词与 词之间是没有分隔符的,因此若想建立基于词的索引,就需要专门的技术,这种 技术被称之为“汉语词语切分技术”。根据是否采用词语切分技术,中文搜索引 擎又可分为基于字的搜索引擎和基于词的搜索引擎。由于中文信息处理的特
lucene-1.4.3
- java分词技术,只实现英文分词,但是该分词算法很经典(来源于apache)-java-term technology, achieving only English Word, but the Word algorithm classic (from apache)
SplitCNWord
- 一个中文分词的实现及演示程序,可用与中文和英文词组的分割.-a Chinese word achieve and demonstrate the procedure can be used with the Chinese and English phrase segmentation.
2006111
- 支持英文、数字、中文(简体)混合分词 常用的数量和人名的匹配 超过22万词的词库整理 实现正向最大匹配算法 智能数字,日期,人名识别。-support English, figures, Chinese (simplified) mixed at the number of commonly used words and the names of more than 220,000 matching word thesaurus fin
FlexCRFs-0.3
- Hieu Xuan Phan & Minh Le Nguyen 利用CRF统计模型写的可用于英文命名实体识别、英文分词的工具(开放源码)。CRF模型最早由Lafferty提出,全名conditional random fields,该模型后来被广泛地应用在语言和图像处理领域,并随之出现了很多的变体。FlexCRF就是对CRF模型的一个实现应用工具,可用于文本信息处理-Hieu Xuan Phan
code1
- 我做了几个英文分词的程序,java实现的,这是第1个,共享给大家-I make a few words in English sub-procedures, java realize, this is the first one to share to the U.S.
code2
- 我做了几个英文分词的程序,java实现的,这是第2个,共享给大家-I make a few words in English sub-procedures, java realize, this is the first two, share to everybody
code3
- 我做了几个英文分词的程序,java实现的,这是第3个,共享给大家-I make a few words in English sub-procedures, java realize, this is the first three, shared with U.S.
code4
- 我做了几个英文分词的程序,java实现的,这是第4个,共享给大家-I make a few words in English sub-procedures, java realize, this is the first four, sharing to the U.S.
src_v1.3.01
- KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法 * 主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力 * 主要性能指标: * 分词准确度:90%以上(有待专家的权威评测) * 处理速度: 600KBytes/s-KTDictSeg Profile: KTDictSeg english by KaiToo developed a s
File_Search
- 中英文分词程序,在文本检索中要使用到得一个小程序哦-In English and Chinese word segmentation procedure, text retrieval, we should use to get a small program oh
yinwenfenci
- 英文分词,根据字典的词对英文无空格的词序列进行分解-The English word, according to word dictionary of English words without spaces in the decomposition sequence
简单基于词典的分词(带txt语料库)
- 基于词典的分词,用于英文文本对文本进行词典的分词(Based on the word segmentation of the dictionary, used in the English text of the text of the dictionary word segmentation)