资源列表
[中文信息处理] chcv521_src
说明:This software performs code conversion of Chinese characters, including GB2312/GBK and BIG5. It also supports some encodings of Chinese character code which are used widely in Japan, such as Chinese Writer, cWnn,<熊刚> 在 2025-02-08 上传 | 大小:891kb | 下载:0
[中文信息处理] seadog-installer
说明:对于垂直搜索引擎来说,网络蜘蛛是非常重要的,因为在垂直搜索领域,数据的收集工作都是由蜘蛛程序来完成的。垂直搜索引擎除了要设计蜘蛛程序外,还要管理这些蜘蛛程序的运行,这是比较复杂的工作。如果缺乏一套有效的管手段,那么垂直搜索引擎将面临一场恶梦。 然而幸运的是,我们有了海蛛--这个领先的垂直搜索专用网络蜘蛛系统。有了海蛛,垂直搜索更简单!使用了海蛛,一切变得有条不紊,变得简单起来。 -The vertical search<峰云> 在 2025-02-08 上传 | 大小:16.02mb | 下载:0
[中文信息处理] 37724094Web_Crawler
说明:网络爬虫源代码,大家好好学习!C++实现-Network reptiles source code, we can learn from! C to achieve<yukie> 在 2025-02-08 上传 | 大小:66kb | 下载:0
[中文信息处理] TxyCat-svmcls
说明:基于径向基函数的神经网络文本自动分类系统。-Based on Radial Basis Function neural network automatic text classification systems.<优优> 在 2025-02-08 上传 | 大小:1.7mb | 下载:0
[中文信息处理] HJ_SegWord_GBK
说明:好不容易找到的一个php分词程序,很好的,里面包含了10万词条-Hard to find a php segmentation procedures, very good, which contains 100,000 entries<丁宇聪> 在 2025-02-08 上传 | 大小:683kb | 下载:0
[中文信息处理] text_category
说明:中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。-Chinese automatic classification. The use of spider crawl network information, the use of Lucene sub-word and KNN methods.<TZH> 在 2025-02-08 上传 | 大小:8kb | 下载:0