Python爬取4000条猫眼评论,带你围观2021最烂院线电影


这与国内的情况也是相似的,同一部电影猫眼淘票票的分数普遍比豆瓣上要高。 毕竟真金白银去看电影的人,肯定会认为它是一部好片子才去看。 只要不像被《爱情公墓》一样诈骗,基本观众的分数不会太低。


爬虫大法好
http://m.maoyan.com/mmdb/comments/movie/movieid.json?_v_=yes&offset=15&startTime=xxx
movieid:网站中每部影片的唯一 id startTime:当前页面中第一条评论的时间,每页共有 15 条评论

诈骗式营销


# 绘制词云图
def gen_stylecloud(text, file_name):
stylecloud.gen_stylecloud(text=' '.join(text), max_words=300,
collocations=False,
font_path=r'C:\Windows\Fonts\msyh.ttc',
icon_name="fas fa-thumbs-down",
size=800,
output_name=f'{file_name}.png'
)
gen_stylecloud(text=text1, file_name='词云图')
Image(filename="词云图.png")


被消耗的沈腾



剧情好到哪里了吗
python
筛选并截取涉及剧情的评论,具体方法如下所示

注:在计算中,关键词“不搞笑”和“搞笑”是区分开统计的,所以并非由于“不搞笑”的评论而导致“搞笑”词云占比大。
写在最后
一键三连「分享」、「点赞」和「在看」
技术干货与你天天见~
评论