《 打工人分析简报 》

大数据DT

共 2778字,需浏览 6分钟

 ·

2020-11-03 11:34


导读:打工人怎么就火了?本文用Python爬取微博、b站相关话题的数据,来一探究竟。


作者:小Z远辰
来源:数据不吹牛(ID:shujubuchuiniu)



最近打工人这个梗和相关的沙雕梗火得直烧眉毛。



微博、b站、知乎、朋友圈...广大东西南北漂们突然找准了定位,大家也自知不是满腔热血已经沸腾的奋斗者,我们的真实身份是——打工人。


忽如一夜春风来,千人万人打工仔。


我很好奇,这个神奇的定位(梗)怎么就火起来了?广大工友们在网上都贡献了哪些优质的工作笔记?于是我用Python爬取了微博、b站相关话题的数据,来一探究竟。


b站部分爬取代码(直接跳过完全不影响阅读体验):


url = 'https://search.bilibili.com/all?keyword=%E6%89%93%E5%B7%A5%E4%BA%BA&from_source=nav_suggest_new0&page={}'

def get_target(url,num = 10):
    result = pd.DataFrame()

    for i in range(1,num + 1):
        headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}
        html = requests.get(url.format(i),headers = headers)
        bs = etree.HTML(html.text)

        for sig in bs.xpath('//li[@class = "video-item matrix"]'):
            title = sig.xpath('div[@class = "info"]/div/a/@title')[0]
            click = sig.xpath('div[@class = "info"]/div[3]/span[1]')[0].xpath('string(.)').strip('\n        ')
            danmu = sig.xpath('div[@class = "info"]/div[3]/span[2]')[0].xpath('string(.)').strip('\n        ')
            date = sig.xpath('div[@class = "info"]/div[3]/span[3]')[0].xpath('string(.)').strip('\n        ')
            up = sig.xpath('div[@class = "info"]/div[3]/span[4]')[0].xpath('string(.)').strip('\n        ')
            df = pd.DataFrame({'标题':[title],'播放量':[click],'弹幕':[danmu],'日期':[date],'UP主':[up]})
            result = pd.concat([result,df])

        time.sleep(random.random() + 0.5)
        print('已经完成b站第 {} 页爬取'.format(i))

    return result



01 打工人的火热


马克思曾经没说过:看一个现象有多火,百度指数是最简单粗暴的工具。



对比热度非常高的“特朗普”,“打工人”起于微末,10月20号开始才作为一个独立词条被记录,随后爬坡式增长,到22号和特朗普还有鸿沟般的热度差异。10月23号,“打工人”搜索指数从前一日的8469,飙升至24216,竟然能硬压话题之王“特朗普”一筹。


但是百度指数在新鲜热词的追踪上总是滞后的,我们再看看b站数据,找到这个梗火遍鬼畜区的时间秘密。



9月22日,b站上有了第一声“早安,打工人”的问候,但播放量寥寥。9月23日-10月14日,每天有不到5个新的打工人视频诞生。


10月15号打工人原创视频达到两位数,20号开始,打工人开了狂暴模式,每天原创视频量以阶梯式增长,截止24日,日新增视频达到了258个。


原创视频数量上涨,是拜打工人梗的热度所赐,b站上有哪些魔性又火热的“打工人”视频呢?


从数据上很容易发现有两个明显的爆点,10月16号,“老摸鱼艺术家”的《加油!打工人!》播放量已破320万,充分点燃了打工人的热情。



10月22号up主“三Lu有毒”也在《早安,打工人!》埋伏了一手,把各种打工人优秀的工作笔记串联起来,500万播放量已是唾手可得。



不错,很有精神!


看了一圈鬼畜区的打工人视频,我发现文本都有一些相似的影子,他们都来源于“优秀人打工笔记”。



02 打工人优秀工作笔记


根据爬取的内容,我们挑选了热度比较高的10条优秀打工人笔记,供各位工友学习,共同进步!


早起的打工人要学会忍受孤独!



靠自己的打工人,才是光荣的!


我爱打工,更爱喝水!



单身,可能是因为打工不够努力!



打工必须得努力!



累吗?累就对了,舒服是留给有钱人的。早安,打工人!


冷吗?冷就对了,温暖是留给开小轿车的人。早安,共享单车人 !


奶茶好喝吗?好喝就对了!奶茶是奖励给打工人心灵慰籍的一剂良药!早安,打工人!


....


打工人段子爆火的背后,其实是大家对于工作现状不满,但又无法通过个体力量短时间改变现状的一种自嘲。


段子的背后总是辛酸。


加油吧,打工人!



划重点?


干货直达?


更多精彩?

在公众号对话框输入以下关键词
查看更多优质内容!

PPT | 读书 | 书单 | 硬核 | 干货 | 讲明白 | 神操作
大数据 | 云计算 | 数据库 | Python | 可视化
AI | 人工智能 | 机器学习 | 深度学习 | NLP
5G | 中台 | 用户画像 1024 | 数学 | 算法 数字孪生

据统计,99%的大咖都完成了这个神操作
?


浏览 7
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报