文件名称:wordbag
介绍说明--下载内容均来自于网络,请自行研究使用
根据一个人物名单文件,查找wekipedia上相应网页,读取网页文本,并统计每个人物在每个网页上出现的次数,最终形成word bag,人物500人,运行时间6分钟左右。-from a namelist making a word bag
(系统自动生成,下载前可以参看下载内容)
下载文件列表
sengoku_removedLabels.txt
__MACOSX
........\._sengoku_removedLabels.txt
sengokuData.py
__MACOSX\._sengokuData.py