搜索资源列表
wbx
- 一组处理五笔输入法码表文件的小程序 chpy.c 将中文字符串自动转换成拼音的形式. 将中文的文件名转换成拼音的文件名- PY_FILE为WIN95全拼输入法反转换生成的拼音编码文件 delsingle.c 删除包含单个汉字的行 gb2312.c 生成所有GB2312码汉字 genwbsig.c 生成所有GB2312码汉字的五笔编码 py.c 去除imegen反编译后的TXT文件中词的编码,只剩下字的编码
无词典分词
- 基于后缀数组的无词典分词算法,通过后缀和散列表获取汉字的结合模式,通过置信度筛选词
wbx
- 一组处理五笔输入法码表文件的小程序 chpy.c 将中文字符串自动转换成拼音的形式. 将中文的文件名转换成拼音的文件名- PY_FILE为WIN95全拼输入法反转换生成的拼音编码文件 delsingle.c 删除包含单个汉字的行 gb2312.c 生成所有GB2312码汉字 genwbsig.c 生成所有GB2312码汉字的五笔编码 py.c 去除imegen反编译后的TXT文件中词的编码,只剩下字的编码
fen
- 基于后缀数组无词典分词算法,利用散列表获得汉字结合模式,通过置信度进行赛选。-Suffix array-based non-dictionary word segmentation algorithm, the use of hash table model was combined with Chinese characters, through the confidence to carry out the election rac
SogouT.mini.tar
- 百度搜索引擎具有响应速度快、查找结果准确全面、时效性强、无效链接少、符合中文语言特点和中国人使用习惯等优点。 1...这种方法只需对语料中的字组频度进行统计,不需要切分词典,因而又叫做无词典分词法或统计取词方法。但这种方法也有一定- IHTMLDocument3* pHTMLDoc3 HRESULT hr = m_pHTMLDocument2->QueryInterface(IID_IHTMLDocument
source
- 主要是电子词典设计(基于ucos2,WinCE,linux等操作系统的,和在ADS下无操作系统的)和一个ADS下的以太网通信-Mainly electronic dictionary design (based on ucos2, WinCE, linux and other operating systems, and in the ADS under the non-operating system) and an ADS unde
dictionary
- *面的电子词典小软件 大一时的C++作业。-No small software interface of the electronic dictionary freshman C++ operations.
javachinesepinyin-bundle
- 这是一个中文拼音输入法的Java实现,基于HMM模型,无词典,能完成拼音转汉字,和汉字转拼音的任务,并结合Edit Distance使其具有中文输入纠错功能。-This is a Chinese Pinyin input method of the Java implementation of HMM-based model, no dictionary, to complete Pinyin turn Chinese characte
CatDemo
- JAVA文章检索 压缩包无加密,含有源代码 可运行,无错误,功能:1.分词;2.能添加新的词典 希望对下载的朋友们有帮助(JAVA article search compression package, no encryption, containing the source code can run, no error, function: 1. word segmentation; 2. can add new dictionari
PinYin
- 拼音输入法,单纯的二元模型,正确率较低,无词典优化(pinyin two-elements model)