文件名称:HLSeg_JAVA_Example
- 所属分类:
- JSP源码/Java
- 资源属性:
- [Java] [源码]
- 上传时间:
- 2012-12-29
- 文件大小:
- 398kb
- 下载次数:
- 0次
- 提 供 者:
- 李**
- 相关连接:
- 无
- 下载说明:
- 别用迅雷下载,失败请重下,重下不扣分!
介绍说明--下载内容均来自于网络,请自行研究使用
中文分词
支持对输出颗粒的控制,可以输出普通颗粒与用于检索的小颗粒;同时输出词串所在句号、段号、词号、词性等信息。
关于分词输出颗粒,我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。
海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域, 用于提升信息分析的有效性和准确性 另外一种应用为小颗粒度分词也叫检索优化分词接口, 用于信息检索领域, 用于提升查全率。-Massive system now provides the rules of the two particles, which, by default for large particles interface, mainly used for automatic classification, the validity of the information maximization, machine translation, speech synthesis, artificial intelligence and other fields, used to improve information analysis and accuratesex another application for small-grained segmentation also called retrieve optimize segmentation interfaces, for the field of information retrieval, used to improve the recall rate.
支持对输出颗粒的控制,可以输出普通颗粒与用于检索的小颗粒;同时输出词串所在句号、段号、词号、词性等信息。
关于分词输出颗粒,我们认为各种应用对分词要求的颗粒度是不同的. 比如自动分类、关键词抽取比搜索需要的分词颗粒度要大, 因为这样表示文本语义特征时效果会更好, 而检索有一个查全率的要求, 就需要把分词单位做的更为细致, 不然就会造成漏查。
海量系统现在提供了两种颗粒的规则, 其中, 默认的为大颗粒接口, 主要用于自动分类、信息挖潜、机器翻译、语音合成、人工智能等领域, 用于提升信息分析的有效性和准确性 另外一种应用为小颗粒度分词也叫检索优化分词接口, 用于信息检索领域, 用于提升查全率。-Massive system now provides the rules of the two particles, which, by default for large particles interface, mainly used for automatic classification, the validity of the information maximization, machine translation, speech synthesis, artificial intelligence and other fields, used to improve information analysis and accuratesex another application for small-grained segmentation also called retrieve optimize segmentation interfaces, for the field of information retrieval, used to improve the recall rate.
(系统自动生成,下载前可以参看下载内容)
下载文件列表
JAVA调用样例代码
................\testHLSeg
................\.........\.classpath
................\.........\.project
................\.........\.settings
................\.........\.........\org.eclipse.jdt.core.prefs
................\.........\bin
................\.........\depends
................\.........\.......\commons-codec-1.5.jar
................\.........\.......\commons-httpclient-3.1.jar
................\.........\.......\commons-logging.jar
................\.........\.......\hylanda-reidxclient-1.0.3.jar
................\.........\HLSegment.xml
................\.........\src
................\.........\...\testHLSeg.java
................\样例代码说明.txt
................\测试用输入XML
................\.............\HLSegment.xml