Python爬虫解析当红网剧之《我是余欢水》
作者:俊欣
来源:数据分析与篮球
而今天小编要探讨的剧集则是有郭京飞、苗苗、高露等实力派演员参演的豆瓣评分7.4分的《我是余欢水》。
该剧是由正午阳光出品,而在该部剧之前,正午阳光就已经接连推出了好几部家喻户晓的电视连续剧,有我们熟悉的《琅琊榜》、《伪装者》、《欢乐颂》等等,
久而久之,该影视机构也被冠上了“国剧门脸”等称号,在业界更是有“正午阳光出品,必是精品”等美誉。今天,小编就从几个主流的视频网站的弹幕中解析观众对该剧的评价以及剧中人物对现实生活的隐喻。
1B站
哔哩哔哩的弹幕数据其实被隐藏在了源代码当中,以XML的数据格式进行加载,比如在本篇文章中引用到的https://comment.bilibili.com/177647056.xml,其格式的形式也就是:一个固定的url地址 + 视频的cid + .xml,只要找到你想要的cid,替换这个url就可以爬取所有的弹幕了(b站大部分网页给出的弹幕限制是1000条),而寻找该视频的cid只需打开网页源代码,然后搜索cid便可寻得,
2爱奇艺
而爱奇艺的弹幕数据寻找起来也相当的容易,打开开发者工具->点击Network->在筛选框中输入bullet,下载之后用zlib打开,便是我们想要的弹幕,具体代码如下,
再来分析一下url的构造,发现只需要得到相应的tvid就行,只要遍历x就能得到一集的弹幕,再遍历所有tvid就能获取所有的弹幕,
3腾讯视频
而腾讯视频的弹幕数据获取也是极其的类似,同样的在筛选框中输入danmu,逐一查找就能获取我们想要的弹幕,而且还是以json文件存储,要想获取一整集的所有弹幕只需要在time_stamp参数上面加以修改便是,起始值是15每30秒更新一次,而target_id则决定集数,同样也可以在html当中获取,具体得代码如下
而从观众的弹幕当中我们能够看得出来,作为男一号 的余欢水在生活当中所面临的窘境,在家里时不时地被家人嫌弃,在单位也时不时地被单位领导与同事嘲笑与谩骂,可见人到中年时的无奈与不堪。
4剧评
整部剧都在用一个特别欢快的语气在讲述着一个非常悲惨、丧到真实的故事,我们在笑声中打量着余欢水悲凉而又倒霉的经历,像是在看一部喜剧,但是又时常会为里面真实贴近生活并且心酸的场景而感到动容,看着男主身上发生的种种不幸,总是能让作为观众的我们有种似曾相识的感觉。
然鹅当时日不多的男主开始硬气起来的时候,身边的人的态度也随之发生了大的转变,余欢水这才发现原来人真的会欺软怕硬,先前害怕与恐惧的原来不过都是纸老虎,先前不敢做与尝试的事情原来都可以轻松地解决,先前当你连自己都不相信自己的时候,所有人都会争先恐后的踩上一脚,让你陷入无止境的自我怀疑当中,而当自己硬气起来的时候,给你挡道与使绊儿的人都怂得不堪一击,甚至巴不得讨好你。
所以总的来说,《我是余欢水》是一部丧到不行的黑色讽刺喜剧,但更是一部鼓励成年人的高级爽文,借着剧中的故事鼓励大家,“除了生死,没有大事”,也许许多人的一生都有一段类似余欢水的存在,比如近期受到疫情影响,许多人都被迫接受降薪甚至是离职的尴尬处境,但也一定会剧中的男主一样,振作起来,好运一定会来,加油!!
◆ ◆ ◆ ◆ ◆
长按二维码关注我们
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码: