n行Python代码系列:两行代码实现视频文件指定时刻画面输出

共 3514字,需浏览 8分钟

 ·

2021-07-21 22:27

一、引言

最近看到好几篇类似“n行Python代码…”的博文,看起来还挺不错,简洁、实用,传播了知识、带来了阅读量,撩动了老猿的心,决定跟风一把,推一个“n行Python代码系列”文章。


对于视频中的精彩画面,有时希望截图保存,通过截屏软件即可实现,但截屏软件只能通过播放软件定位时间,该时间精确度为秒,对一些特殊需求如科研观察来说不够,另外截屏软件可能会将播放器的一些控制组件也截屏下来。如下面的《粉丝记事本》的MV截取10秒位置的图片:



本文介绍两行代码实现将视频指定时刻画面输出到文件的方法。更多“n行Python代码系列”文章请参考CSDN老猿Python的免费专栏《n行Python代码系列》。


二、等时间间隔输出视频画面

要进行视频剪辑,老猿使用的Moviepy。下面代码使用的视频《粉丝记事本》,我们来每隔10秒输出一张视频画面。代码实现如下:

from  moviepy.editor import *
clip = VideoFileClip(r"F:\video\fansNote1M_crop.mp4")clip.save_frame (r"F:\video\fansNote1M.jpg",9.75)

上述三行代码先实现Moviepy模块的加载、然后读入视频文件、进行指定时间的画面输出到指定文件。以上三行代码也可以精简为如下两行:

from  moviepy.editor import *
VideoFileClip(r"F:\video\fansNote1M_crop.mp4").save_frame (r"F:\video\fansNote1M.jpg",9.75)

我们来看看结果文件的内容:

和上面的截图对比一下,可以体会前面截屏软件遇到的问题。


三、背景知识

3.1、moviepy介绍

要实现视频剪辑,老猿使用了moviepy库。


MoviePy是一个用于视频编辑的Python模块,可用于进行视频的基本操作(如剪切、连接、标题插入)、视频合成(也称非线性编辑)、视频处理或创建高级效果。


它可以读写最常见的视频格式,包括GIF。MoviePy能处理的视频是ffmpeg格式的,老猿理解支持的文件类型至少包括:*.mp4 *.wmv *.rm *.avi *.flv *.webm *.wav *rmvb。


MoviePy使用ffmpeg读取、导出视频和音频文件,使用ImageMagick生成文本和输出GIF文件。Python的快速数字库Numpy保证了不同媒体的处理。高级效果和增强使用了Python的许多图像处理库(PIL、Scikit-image、scipy等)。


moviepy的核心对象是剪辑(clips),包括AudioClips 和VideoClips。它们可以修改(剪切、减速、变暗…)或与剪辑混合以形成新剪辑,可以使用PyGame或IPython Notebook预览,并可以输出到对应类型的文件(如MP4、GIF、 MP3等)。例如,VideoClips可以从视频文件、图像、文本或自定义动画创建。VideoClips可以有一个音频轨道(这是一个AudioClip)和一个mask(一个特殊的VideoClip,指示当剪辑与其他剪辑混合时要隐藏哪些部分)。


3.2、moviepy安装

MoviePy安装非常简单,使用pip安装时,请将站点指向国内的镜像站点,否则下载很慢或者下载不下来,老猿使用清华的镜像,指令是:


pip install -i https://pypi.tuna.tsinghua.edu.cn/simple moviepy


注意:

1、moviepy全小写,安装时会自动安装相关依赖包;


2、建议安装最新的版本1.0.3,因为1.0.2中有个比较大的bug,请见《在Python中使用moviepy进行视频剪辑时输出文件报错 ‘NoneType’ object has no attribute 'stdout’问题》;


3、如果没有安装最新版本,可以执行版本升级,指令:


pip install -i https://pypi.tuna.tsinghua.edu.cn/simple moviepy --upgrade


关于Moviepy更多的介绍,请参考老猿的免费专栏《PyQt+moviepy音视频剪辑实战》。


3.3、相关函数

上述代码涉及到的相关函数包括VideoFileClip、save_frame。


3.3.1、VideoFileClip

VideoFileClip实际上是一个类,其构造方法如下:


__init__(self, filename, has_mask=False, audio=True, audio_buffersize=200000,target_resolution=None, resize_algorithm=‘bicubic’,audio_fps=44100, audio_nbytes=2, verbose=False, fps_source=‘tbr’)`


参数说明:


  • filename:视频文件名,可以带路径

  • has_mask:是否有遮罩,如果视频文件带遮罩,则设置has_mask为True。视频文件一般很少带遮罩,但有些视频编码支持遮罩功能。例如如果moviepy合成了一个带遮罩的剪辑,则可以使用《moviepy音视频剪辑:视频剪辑基类VideoClip的属性及方法详解》介绍的VideoClip.write_videofile将剪辑和遮罩、音频信息一起保存到视频文件中

  • audio:如果视频文件不带音频或者不希望加载视频文件的音频,可以将audio参数设置为False

  • audio_buffersize:音频文件读取缓冲区大小,字节为单位,一般用缺省值足够,如果audio_buffersize比一个音频帧的大小还要小,会自动使用音频帧的大小代替

  • target_resolution:设置为加载后需要变换到的分辨率,类型为列表或元组,第一个元素为分辨率的高,第二个为宽,如果高或宽有一个为None,则保持现有纵横比调整帧的大小。如果保持原分辨率不变,则不需要设置本参数或设置为None。如果设置了新的分辨率,则在调用ffmpeg 返回视频剪辑的帧之前会按新的分辨率调整帧的大小。这比使用转换为高分辨率流然后再调整分辨率会快很多

  • resize_algorithm:要改变加载后的视频分辨率,可以通过resize_algorithm指定调整分辨率的算法,缺省值为 “bicubic”,还可以是 “bilinear” 、"fast_bilinear"等。关于算法的更多信息请参考:https://ffmpeg.org/ffmpeg-scaler.html

  • audio_fps:声音的采样频率

  • audio_nbytes:声音采样的位数

  • verbose:是否在标准输出设备上显示处理信息

  • fps_source:从视频的元数据metadata哪个数据中获取fps值,默认设置为’tbr’,但可以设置为’fps’,这可能有助于导入慢动作视频,否则可能会出意外。


3.3.2、save_frame函数

save_frame函数用于将t指定时刻位置的帧保存到指定图像文件。调用语法如下:

save_frame(self, filename, t=0, withmask=True)
  • filename:输出图片文件名

  • t:指定时刻,以输出75.35秒为例,t的表示方法可以是如下四种之一:

    √ 数字秒,为一个浮点数数字,如75.35

    √ 分钟和秒组成的元组,如(1,15.35)

    √ 时、分、秒组成的元组,如(0,1,15.35)

    √ 用冒号分隔的时间字符串,如‘0:1:15.35’


  • withmask:如果withmask为True,对应帧的遮罩会被写入图片的alpha通道层,仅对PNG图像有效


四、小结

本文介绍了使用Python+Moviepy 两行代码实现将视频输指定位置的图片画面输出到图片文件的方法,并介绍了moviepy的功能及安装以及相关处理的关键函数及语法。



浏览 40
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报