福利啊!120行代码,用Python批量抓取B站小姐姐的舞蹈视频,满屏美腿!

菜鸟学Python

共 2270字,需浏览 5分钟

 ·

2022-03-04 14:11

大家好,我是菜鸟哥!周末宅在家没有事情,只能看看动漫,逛逛B站。

最近,菜鸟哥都在B站上欣赏小小姐姐的舞蹈视频,像是“欣小萌”、“慕慕有奶糖”等UP主都是菜鸟哥的关注对象。菜鸟哥只是单纯的从舞蹈欣赏的角度,来观看小姐姐们的舞蹈视频。


刚好,菜鸟哥也已经好久没有为大家奉上福利了,今天,就带领大家,来批量抓取小姐姐们的舞蹈视频,让大家一次看个够。


01.抓取视频子页面地址

接下来的内容,我们将以“欣小萌”的视频抓取为例进行。

首先,我们打开舞蹈视频的主页,可以看到所有的舞蹈视频内容。

看到这样的界面,熟悉菜鸟哥之前文章的小伙伴们也大概知道抓取的流程。通过F12,打开开发者模式,然后再“network”下,找到以“search?mid=”开头的链接。点进去后,就可以看到舞蹈视频的关键信息内容。


我们需要抓取的就是bvid数据,通过这个数据,便可以构建每个舞蹈视频的链接,例如:https://www.bilibili.com/video/BV1uR4y1G7bd

当然,我们的程序可以借鉴之前菜鸟哥同大家分享的(这里贴上扬名立万的链接)程序,来抓取每个舞蹈视频的bvid数据。


上述程序的内容分析,也可以借鉴之前分享的文章。获取到bvid数据后,接下来我们就来分析如何下载视频到本地。


上述的程序中,是视频提取程序的入口函数。

第7行程序,首先提取出链接地址当中的BV数据,也即bvid数值。

第8行程序,利用get_cid函数,获取cid的数据;

第9行程序,利用get_list函数,来获取视频的链接地址。

第11-15行程序,通过requests库抓取视频写入到本地。


上述程序中,给出了get_cid和get_list函数,函数都是利用requests库来向链接请求json数据,然后提取json数据当中的关键信息。

值得注意的是,上述的第11行程序中,构造的请求链接,有“qn”参数。其中,80表示的是1080高清。数值与清晰度的对应关系,如下表所示。


02.结果展示

程序讲解完毕后,接下来我们就看一下抓取的结果吧。

上图展示的是抓取视频的封面,可以看到,几乎每张封面都是小姐姐的舞蹈动作。下面菜鸟哥为大家展示一个小姐姐的舞蹈视频。


视频展示



总结:

以上就是菜鸟哥今天为大家带来的福利内容,希望大家在学习程序的同时,能够下载自己喜欢的B站小姐姐舞蹈视频。


其实Python功能还是很强大,爬虫,数据分析,机器学习,自动化测试,运维,web网站后端开发样样都可以做,真的是非常一门值得学习的语言。有兴趣的同学可以操练起来,欢迎大家在下方留言吱一声,记得给个三连哦!


我是菜鸟哥,我们下期文章不见不散。


有兴趣的同学可以火速加入我们的星球
3周零基础入门提供10节课程
全年12节趣味实战项目含源码,
每月奖励优秀的Top3同学送书
专业的答疑群,大厂的老师保姆式的教学

如果不满意,三天内随意退款!一年88,现在优惠16元


扫码加入,3周零基础入门





推荐阅读:

入门: 最全的零基础学Python的问题  | 零基础学了8个月的Python  | 实战项目 |学Python就是这条捷径


干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 |   从万众期待到口碑扑街!唐探3令人失望  | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影


趣味:弹球游戏  | 九宫格  | 漂亮的花 | 两百行Python《天天酷跑》游戏!


AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影


小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!|  再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!


年度爆款文案

浏览 64
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报