搜索资源列表
stopword
- 这里是用于特征提取时去除停用词的词表,很有用的.-here for feature extraction to remove the word out thesaurus, very useful.
WordFrequencyStat-cipintongji
- ...将该字符串变量与停用词表中的所有单词进行比较,若果该词在停用词表中出现过则不对其进行统计,否则在对该词进行词干抽取。 经过以上停用词、词干处理后得到的将是实际进行统计的“单词”(此时的“单词”实际上已经是所有具有相同词干的原是单词的统一代表)... 注:jar包中含有完整的java源程序代码,仅供学习参考之用,传播时请保持本软件包的完整性 ---ZHG工作室 2008.4 E-mail:wudazhg@163.com A
stopwords
- 中英文中的常用的停用词,对文本分析有帮助的!
stop.rar
- 本代码用c语言编写,用于在文本分类预处理过程中停用词的去除。
中文停用词
- 中文停用词
stopword
- 这里是用于特征提取时去除停用词的词表,很有用的.-here for feature extraction to remove the word out thesaurus, very useful.
WordFrequencyStat-cipintongji
- ...将该字符串变量与停用词表中的所有单词进行比较,若果该词在停用词表中出现过则不对其进行统计,否则在对该词进行词干抽取。 经过以上停用词、词干处理后得到的将是实际进行统计的“单词”(此时的“单词”实际上已经是所有具有相同词干的原是单词的统一代表)... 注:jar包中含有完整的java源程序代码,仅供学习参考之用,传播时请保持本软件包的完整性 ---ZHG工作室 2008.4 E-mail:wudazhg@163.com A
stopwords
- 中英文中的常用的停用词,对文本分析有帮助的!-Chinese and English in common stop words, the text analysis help!
stop
- 用来去除英文文档中的停用词,将一些高频词从文档中删除-English documents used to remove the stop words, some high-frequency words will be deleted from the document
irtools.tar
- 信息检索中常用的技术,包括单词的词干提取和一些停用词的划定。-The common technique in IR. It contains stemmer extraction and stopper deletation
lzj
- 根据一个停用词表,输入一个词语。然后来 判断一个词语是否为停用词 -Stop words based on a table, enter a word. And then to determine whether a stop word terms
stop_word
- 停用词库,四川大学机器智能实验室。用于文本数据挖掘的预处理。-Disable thesaurus, Sichuan University, Machine Intelligence Laboratory. Pre-processing for text data mining.
vb
- 连接数据库 分词 去除停用词 计算权重值-Connect to the database to remove stop words word weighted value
StopWordListExpanded
- 停用词表扩展,里面有所有的常用的停用词,在信息检索时需要进行去高频词的操作,就需要停用词表,需要的下载-Disable vocabulary expansion, which have all the common stop words, in the information retrieval to the high-frequency words when the need for the operation, you need t
bayes
- 朴素贝叶斯分类器包括了停用词的处理,结果是很不错的-Naive Bayesian classifier
Python
- 代码主要为使用Python去停用词,做词云图,使用的数据是从电商平台抓取的。(Use Python to deactivate words and make word clouds)
segmentation
- 对文本进行分词,使用停用词表去除停用词,标点等。(segmentation, and deleting stop words and punctuations.)
stopwords
- 中文停用词表(停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。)(Chinese Stop Words List)
新建文件夹
- 文本处理,自然语言处理,包含中文和英文停用词(text processing,including chinese and english stopwords)
停用词表
- 在自然语言处理任务中常用的停用词表,可以去除中文停词(Frequently used stop lists in natural language processing tasks, Chinese stop words can be removed)