搜索资源列表
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化
stopwords
- 中英文中的常用的停用词,对文本分析有帮助的!
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化
stopwords
- 中英文中的常用的停用词,对文本分析有帮助的!-Chinese and English in common stop words, the text analysis help!
StopWords
- A English Stop word class. It helps to check whether your word is stopword or not.
9927445TestTrec
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是 Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优
Vectortfidstopwords
- Information retriever based on cosine similarity with TFIDF weights and stopwords
StopWords
- This application removes all stop words from the given text document and performs stemming operation.
stopwords
- a program to remove stopwords from the text file for faster data processing
stopwords
- The system will find the cluster where the target student belongs to based on student number. Inside the cluster, the system will compute the most similar students to the target student using
cut-stopwords
- 语义网中,文本分析、信息检索常用的停用词!-The Semantic Web, text analysis, information retrieval used stop words!
jquery.dynacloud-5
- DynaCloud是一个jQuery插件,生成标记或关键字云从web页面上的文字,突出关键字匹配部件一旦点击。 几个方面的DynaCloud可以定制。 Stopwords 限制数量的标签 排序标签 自动生成标签云 -DynaCloud is a jQuery plugin that generates tag or keyword clouds from text on web pages and highlig
stopwords-
- 英文文本词根还原+去停用词小工具 本小程序用以对指定目录下的英文文本文档执行批量还原处理,能够识别单词与单词之间的标点或连字符等,保持原文格式。比较强大的是能把整个文件夹包括小文件夹的都给处理了-This small program used to perform volume reduction treatment, able to identify between the word and the word punctuation
StopWordHander
- 1、文件转换为字符串 2、文本文件分词后转换为ArrayList 3、从文件读取停用词用转换为ArrayList 4、从ArrayList中剔除停用词 5、利用正则表达式将文本文件中的数字、字母剔除-delete stopwords from texts
stopwords-
- 中文停用词表,比较全面,有1208个,通用词就是的,是,呢,了这样的词-Chinese stop word table, more comprehensive, 1208, is a generic term, is that it, such a word
Engilsh-Chineas-StopWords
- 中文和英文的停用词词库,在信息检索方面能用到-this is the English and Chines Stop-words,you can use this in Information Searching program
stopwords
- In this file you can use English stop words. The usage of this words may can helpful in analyzing content and deleting irrelevant content.
word20130814.cpp
- c++ stopwords removal
新建文件夹
- 文本处理,自然语言处理,包含中文和英文停用词(text processing,including chinese and english stopwords)