搜索资源列表
豆瓣爬虫
- 爬取豆瓣top250电影资料, ①requests库获取html信息 getHTMLText(url)方法实现 ②通过BeautifuSoup库与re库整理筛除信息 stringTidy(string) parsePage(html)方法实现 ③最后读入文件中 getMovieInfo(movieList,fpath)方法实现(python use request method getHTMLText(url) get htm
top250
- 执行即显示top250基本信息,最后输出执行花费时间(Execution is the display of top250 basic information and the final output of the execution time)
douban250
- 使用python3,爬取douban top250电影(crawle douban top250 movies)
爬取豆瓣电影Top250
- 通过python语言,利用爬虫、词云等模块,爬取豆瓣电影评分前250(Climbing the top 250 of Douban Movie)