python爬虫,Scrapy爬取豆瓣电影《芳华》电影短评,分词生成词云图。

368次阅读
没有评论

项目github地址:https://github.com/kocor01/scrapy_cloud

Python版本为3.6

自己写的简单架构《python爬虫,爬取豆瓣电影《芳华》电影短评,分词生成词云图。

这个是用Scrapy框架重新实现的

爬虫爬取最近比较火的电影《芳华》分词后生成词云图

使用了 jieba分词,云图用wordcloud生成

用了朋友的2B姿势的自拍照片简单的P了下(为了不暴露,P成全黑的),作为生成词云图的底图模板

在生成词云图的过程中,发现一个问题,词云图底图模板有PNG格式的图片生成出来的效果很差,例如用下图PNG格式去生成,生成出来的词语图根本不成人形。本例是用JPG格式的图片去生成,生成出来的效果还是相当不错的。建议底图用JPG去生成。其他格式的图片没试验,不知生成的效果如何。

词云图底图模板:

python爬虫,Scrapy爬取豆瓣电影《芳华》电影短评,分词生成词云图。

生成词云图效果:

python爬虫,Scrapy爬取豆瓣电影《芳华》电影短评,分词生成词云图。

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:Python教程2022-10-25发表,共计369字。
新手QQ群:570568346,欢迎进群讨论 Python51学习