资源列表
[中文信息处理] mlct_public
说明:这是一个基于Java的分词、N-gram统计、分段 、分句等功能的程序,支持多种语言-This is a Java-based segmentation, N-gram statistics, the sub-clause of the function procedures, multilingual support<张雨> 在 2008-10-13 上传 | 大小:353.88kb | 下载:1
[中文信息处理] classifier-1.12
说明:能对从Google中搜索出来的文本进行聚类,提供了Java包,及调用源代码.-can right from the Google Search for the text clustering, a Java package, source code and call.<廖剑> 在 2008-10-13 上传 | 大小:1.36mb | 下载:1
[中文信息处理] ChineseCodeP
说明:一个详细的汉字编码介绍以及判断汉字编码的程序代码。不知道有没有人曾经为汉字的编码问题头疼不已?这篇文档讲述了GB2312-80、GBK、Unicode编码、Big5编码的规律,并给出了判断一个汉字为GBK和Big5码的VB代码程序。-a detailed descr iption and a Chinese character coding judgment Chinese character coding procedure code<绿风> 在 2008-10-13 上传 | 大小:28.39kb | 下载:1
[中文信息处理] TestCorpusyuliaoguanli
说明:1. 这是一个简单的语料库管理系统 2. 可以添加和删除语料文件,统计语料中的字数 3. 可以查找语料中的汉字串以及重叠形式 4. 语料文件存放在corpus目录下,查询结果保存在跟语料库相同目录下 5. corpus目录下有4个文本文件(其中test1, test2是两个小文件)供测试用 6. 只能处理文本文件,GB内码-1. This is a simple Corpus management system 2.<刘红周> 在 2008-10-13 上传 | 大小:80.37kb | 下载:1
[中文信息处理] EnterprisesSalaryManagementSystem
说明:这是用VFP设计的企业工资管理系统,各部分都有,只是没有把它们链接在一起!-This is designed with VFP enterprises wage management system, every part, but there was no link them together!<李宝宝> 在 2008-10-13 上传 | 大小:240.87kb | 下载:1
[中文信息处理] WordSimilarityss
说明:基于知网的词汇语义相似度计算 C 源码,软件使用手册.-Semantic similarity calculation of C source code, software manuals.<wu> 在 2008-10-13 上传 | 大小:987.78kb | 下载:1