资源列表
[中文信息处理] Chinesesegmentbasedonwordlibrary
说明:具有三级索引词库结构的中文分词方法研究 -Three-tier structure with a thesaurus of indexing Chinese word segmentation method<lyh> 在 2025-02-08 上传 | 大小:42kb | 下载:0
[中文信息处理] wordsegmentbasedonChinesetext
说明:一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统-Chinese text classification based on the sub-word method, different from the commonly used methods based on string matching and the use of database-specific queri<lyh> 在 2025-02-08 上传 | 大小:87kb | 下载:0
[中文信息处理] SplitWords
说明:splitword,分词,利用,snowball,第三方库-splitword, word segmentation, using, snowball, third-party libraries<张玉> 在 2025-02-08 上传 | 大小:1kb | 下载:0
[中文信息处理] MaxEntModel
说明:最大熵模型与自然语言处理方面非常好的介绍-Maximum entropy model and natural language processing aspects of a very good introduction<spring> 在 2025-02-08 上传 | 大小:479kb | 下载:0
[中文信息处理] FontSetConverter
说明:对文件中的中文做编码转换,支持目录下所有文件的转换,转换格式为UTF8到GBK。-To document the Chinese to do encoding conversion, support for directory conversion of all documents, conversion to UTF8 format to GBK.<> 在 2025-02-08 上传 | 大小:3.52mb | 下载:0
[中文信息处理] ws-uima2code
说明:为了对数据进行处理,UIMA 应用程序将使用分析引擎,而后者包含实际进行分析的应用程序、Annotator 和 XML 描述符文件,其中,XML 描述符文件包含关于类以及其要接收和返回的信息等方面的内容。 还可以将简单的分析引擎组合为更为复杂的分析引擎。例如,定位本地事故报告和广播流量报告的分析引擎可能包含一个查找事故的分析引擎、一个查找位置的分析引擎,以及一个分析前两个引擎提供的注释的分析引擎。总体引擎描述符将确定如何在这些<popt> 在 2025-02-08 上传 | 大小:11kb | 下载:0