资源列表
[中文信息处理] libmyssvd.gnu295.a
说明:libmyssvd, svd开发包.自然语言处理中,进行LSI的必备包,有任何问题可以访问其官方网站或直接和作者联系。<wuhui> 在 2008-10-13 上传 | 大小:813.02kb | 下载:0
[中文信息处理] siuying_segment
说明:「我是中國人」,ChineseTokenizer會將之分割為五個中文字:「我、是、中、國、人」,CJKTokenizer則會將之分割為「我是、是中、中國、國人」四個二節的詞。前者的問題是沒有考慮中文詞語的問題,如搜尋「國中」一樣搜尋到「我是中國人」。後者的問題則是制做了大量沒意義的詞如「是中」「國人」,讓索引沒必要地增大、降低搜尋效率。<李利华> 在 2008-10-13 上传 | 大小:1.59mb | 下载:0
[中文信息处理] pythonChinesecut
说明:在网上下载的程序,本人不但对程序本身做了详细的注释,还对中文切词的一些思路做了一定的介绍,更便于在此基础上进行修改。2007年9月3号在www.pudn.com上首发!<张永伟> 在 2008-10-13 上传 | 大小:2.27mb | 下载:0
[中文信息处理] 860546gbook22
说明:东营人家多用户留言本 2.2 版 留言本演示地址:http://www.860546.net/gbook/index.asp 留言本下载地址:http://www.860546.net/860546.rar 默认用户名、管理密码:admin 数据库连接文件:config.asp 请修改book.mdb为其他名称,为防止下载可修改为book.asp 另外请不要忘记修改相应数据库名称。<王晓东> 在 2008-10-13 上传 | 大小:199.81kb | 下载:0
[中文信息处理] DealWithString
说明:刚刚因公司需要,处理文本文件中每一行存在多个\"|\"的程序,可以得到开始与最后的字段,并用制表符分开<李东> 在 2008-10-13 上传 | 大小:28.68kb | 下载:0