mzhboy/ffmpeg.md

## ffmpeg.md

      
    Raw
  

              ffmpeg.md
            
          
    使用ffmpeg合并MP4文件

ffmpeg -i "Apache Sqoop Tutorial Part 1.mp4" -c copy -bsf:v h264_mp4toannexb -f mpegts intermediate1.ts
ffmpeg -i "Apache Sqoop Tutorial Part 2.mp4" -c copy -bsf:v h264_mp4toannexb -f mpegts intermediate2.ts
ffmpeg -i "Apache Sqoop Tutorial Part 3.mp4" -c copy -bsf:v h264_mp4toannexb -f mpegts intermediate3.ts
ffmpeg -i "Apache Sqoop Tutorial Part 4.mp4" -c copy -bsf:v h264_mp4toannexb -f mpegts intermediate4.ts
ffmpeg -i "concat:intermediate1.ts|intermediate2.ts|intermediate3.ts|intermediate4.ts" -c copy -bsf:a aac_adtstoasc "Apache Sqoop Tutorial.mp4"
视频分割

ffmpeg -ss 00:00:00 -t 00:00:03 -y -i test.mp4 -vcodec copy -acodec copy test1.mp4  
参数解释
说明：上面的这个例子是将test.mp4视频的前3秒，重新生成一个新视频。
-ss 开始时间，如： 00:00:00，表示从0秒开始，格式也可以00:00:0
-t 时长，如： 00:00:03，表示截取3秒长的视频，格式也可以00:00:3
-y 如果文件已存在强制替换；
-i 输入，后面是空格，紧跟着就是输入视频文件；
-vcodec copy 和 -acodec copy表示所要使用的视频和音频的编码格式，这里指定为copy表示原样拷贝；

硬件加速的批量转码

ffmpeg wiki  HWAccelIntro  有介绍，缺点是无法设置 maxrate bufsize gop 。
注意需要安装最新驱动 ，性能实测 1080P HEVC 转 avc 可以达到 50fps 以上，同时 cpu 占有率非常低。
对于安装了NVIDIA GPU 可以在输入前插入 -hwaccel cuvid 选项启用 NVIDIA 的解码器， 但是实测 CUVID 兼容性非常差(安装最新的驱动程序包括 CUDA)，通过在输入文件后添加 -ss 选项测试发现没有视频能够成功打开加速（回落到软件解码）；倒是 nvdec 能够解码部分视频流（主要是 avc ， 根据硬件有别 ）。因此使用 -hwaccel dxva2 代替，注意 dxva2 是由微软实现的，仅运行与 Windows 和 Xbox 平台。
更好的硬件解码使用 libnpp 实现，不过这需要自己手动编译。但是其性能是极好的，因为所有的处理都在显卡上完成，不像上述需要把数据从显卡取回内存然后交由 CPU 处理。
@echo off
mode con cols=200 lines=2500
for /r %%I in (*.mkv) do @ffmpeg -hide_banner -hwaccel nvdec -i "%%I" -ss 0:2:0 -t 0:2:0  -pix_fmt yuv420p -an -c:v h264_nvenc -preset slow -profile:v high -level 4.2 -bf 4 -rc:v vbr_minqp -qmin 19 -qmax 25 -maxrate:v 40M -g 60 o.mp4 -y
title finish
echo �
pause
简要解释：


-hwaccel nvdec 设置硬件解码器为 nvdec ，根据硬件限制可能回落到软件解码


-pix_fmt yuv420p 是必须的，通常是 yuv420p 具体可用项目根据硬件有别。


-rc:v vbr_minqp 可变的 crf


-qmin 19 -qmax 25 允许的最大最小 crf


-bf 4 设置 b-frames 为4，实际是根据硬件限制，通常为2有效


-g 60 设置了 max-gop


-b:v 2500k 设置平均 bitrate


-maxrate:v 40M 设置最大比特率


-level 4.2 手动指定了profile level ，但是一般自动设置为最低比较好，这样更容易被硬件解码


使用ffmpeg转换flv到mp4

ffmpeg -i out.flv -vcodec copy -acodec copy out.mp4
使用ffmpeg截图

Create a thumbnail image every X seconds of the video
ffmpeg -ss 00:10:00 -i "Apache Sqoop Tutorial.mp4" -y -f image2 -vframes 1 test.png
或
ffmpeg -ss 10 -i input.flv -y -f image2  -vframes 100 -s 352x240 b-%03d.jpg
ffmpeg -i test.mp4 -y -f mjpeg -ss 3 -t 1  test1.jpg
ffmpeg -i test.mp4 -y -f image2 -ss 3 -vframes 1 test1.jpg

根据输出尺寸输出图片，并保证输出是偶数。

有时候输入和输入尺寸并不相等，可能需要拉伸显示像素。如输入为 SAR=4:3 ，但是 PAR 被设置为 4:3，这样输出为 SAR*PAR=4：3 。播放器可以识别这个问题并自动拉伸像素，但是ffmpeg产生缩略图时输出的图像是正方形的像素，这时候就需要 重设分辨率了 ，使用 scale='trunc(ih*dar):ih',setsar=1/1 ，为了输出偶数分辨率使用 scale='trunc(ih*dar/2)*2:trunc(ih/2)*2',setsar=1/1 。注意这里设置输出高度与输入相同，但是调整了输出宽度。如果用固定输入宽度调整输出高度的方式用如下例 scale='w=480:trunc(ow/dar/2)*2:flags=lanczos',setsar=1/1 。
ffmpeg -hide_banner -ss 0:7:0 -i input.mp4 -vf "scale='trunc(ih*dar/2)*2:trunc(ih/2)*2',setsar=1/1" -vframes 1 -q:v 80 out.jpg -y
参数解释:
-i  输入文件
-y  覆盖
-f  生成图片格式
-ss 开始截图时间 seconds or in hh:mm:ss[.xxx] 如果截图开始时间越接近篇尾，所花费的时间就会越长
-vframes  截图帧数 或者 使用 -t : 截图时长 seconds, or hh:mm:ss[.xxx]
-q:v 设置输出图像质量
-s  图片宽高比
b-%3d.jpg 格式化文件命名,会生成 b-001.jpg，b-002.jpg 等。

注意：把-ss 10放到第一个参数的位置，速度比放到放到其他位置快，且不会出现如下错误
UPDATE
更方便的保持显示比例的方法是 scale=480:-2 -2这个参数类似 -1 会自动调整宽高以维持显示比例；但是不同之处在于会把数字变成偶数，这样避免了某些解码器输入奇数报错的问题。ref: Maintaining FFMPEG aspect ratio   Keeping the Aspect Ratio
批量调用ffmpeg截图


Windows batch file

mkdir b:\snap
for /R "G:\videodir\" %%I in (*.mkv,*mp4) do @ffmpeg -hide_banner -ss 0:7:0 -i "%%I" -vf "scale='trunc(ih*dar/2)*2:trunc(ih/2)*2',setsar=1/1" -vframes 1 -q:v 80 "b:\snap\%%~nxI.jpg" -y
简单解释： 该脚本在 G:\videodir\ 文件夹下寻找以 mkv/mp4 结尾的文件，传递给ffmpeg执行。输出的图像是根据视频 DAR 设置，输出文件名是 input.mp4.jpg 这样的格式。需要注意的是输出文件都在一个文件夹，在输入文件的 文件名 相同但 路径名 不同的情况下，会发生同文件名覆盖的问题。

linux shell

#!/bin/sh
mkdir 0_snap/
do_snap(){
    fname=$(basename "$1")
    ffmpeg -ss 0:8:0 -i "${fname}" -f image2 -vframes 1 0_snap/"${fname}.jpg"
}

export -f do_snap
find . -maxdepth 2 -type f -name "*.mkv" -exec bash -c 'do_snap "$0"' {} \;
简单解释：大致原理同上面 batch 批处理，根据 Unix 需要做了额外的处理。
find 命令的输出格式始终带 ./ 或者完整路径名，但是我要求输出仅仅有 文件名+后缀 ，通常的方法已不能办到。为此引入 shell function ，由于 shell function 只能被 shell 认识、执行。这就需要 export function_name 然后交由 shell 执行。

Windows batch file 批量截图，特定时间一定数量

@echo off
mkdir b:\snap
for /R "G:\inputdir\" %%I in (*.mkv,*mp4) do @ffmpeg -hide_banner -ss 0:10:4 -i "%%I" -vf "[in]scale='trunc(ih*dar/2)*2:trunc(ih/2)*2',setsar=1/1 [fixaspect]; [fixaspect] fps=1/2 [out]" -vframes 5 -q:v 80 "b:\snap\%%~nxI%%03d.jpg" -y
这里使用了 labeled filtergraph Example: labeled filtergraph outputs 。先把输入重设了宽度，高度保持原样并保证为偶数，设置了输出像素比例为 1:1 ( setsar=1/1 ); 然后设置了输出频率为 1/2fps 即2秒一帧。然后输出截图5张，输出后缀序列按3位数字（%03d）升序排列。
特别注意：videofileter（vf） 需要指定输入输出，其中 [in] [out] 是默认的；ffmpeg输出序列格式是 printf 类似的格式，为了得到有效的 % 要在 % 前面使用 % 来转义它，最终需要写 %%03d 来得到有效输入 %03d 。

为了方便检查结果，给每个被处理视频文件添加一个处理前缀序号
@echo off
mode con cols=200 lines=2500
set outN=8
set outdir=e:\snap0%outN%
IF NOT EXIST %outdir% MD %outdir%
setlocal enabledelayedexpansion
set n=1000
for /R "G:\inputdir\" %%I in (*.mkv,*mp4) do (
set /a n+=1
title !n:~-3!
echo !n:~-3!-%%~fsI > b:\ffmpeg_processing.txt
cd /d "%%~dpI"
@ffmpeg -hide_banner -ss 0:5:24 -hwaccel nvdec -i "%%~nxI" -f image2 -vf "fps=1/10,scale='w=480:trunc(ow/dar/2)*2:flags=lanczos',setsar=1/1" -vframes 5 -q:v 90 "%outdir%\%%~nxI-%%03d.jpg" -y
if !errorlevel! neq 0 echo !n:~-3!-%%~fsI >> "%outdir%\ffmpeg_err.txt"
if !errorlevel! neq 0 echo !n:~-3!-%%~fsI >> b:\ffmpeg_err.txt
)
这里使用了优化的 scale 命令，直接设置了输出宽度，并设置输出高度根据输出宽度和 DAR 匹配并保证为偶数。为了添加序号，需要在处理每个文件之前生成序列号。生成序号使用 set /a 功能进行计算。由于批处理中 for 语句 do 后面括号内的内容被视为一行指令，变量 n 自增的结果并不会立即应用给ffmpeg的参数，为了能够立即使用需要启用 setlocal enabledelayedexpansion 功能。而读取延迟变量使用 !n! 的方式，这里取其最后3位数字。最后得到了类似 006-input.mkv-005.jpg 这样的文件名。
参考：
批处理产生001、002序列数字的文件名
批处理中setlocal enabledelayedexpansion的作用详细整理
批量转换音频


至原文件夹

find input_dir -maxdepth 1 -type f -name "*.flac" -exec ffmpeg -hide_banner -i {} -t 10 -c:a aac -q:a 1.2 {}.m4a -y \;
简要解释：从输入文件夹 input_dir 寻找 flac 文件，寻找深度为 1 ，这意味着不会寻找子文件夹。找到的文件被传递给 ffmpeg 转码，转码长度 10s ，输出格式 aac 使用了 ffmpeg buildin aac 编码器，输出质量 q 范围 0.1~2 ，这里设置为 1.2 ，输出到原文件夹并且名字是 input.flac.m4a 这样的格式。

至原文件夹不带源文件后缀名

find inputdir -maxdepth 1 -type f -name "*.flac" -exec bash -c 'fin="$0";ffmpeg -hide_banner -i "$0" -t 10 -c:a aac -q:a 1.2 "${fin%.*}.m4a"' {} \;
简要解释：输出的设置跟上面的类似，为了获取不带后缀名的文件名，使用了 Shell Parameter Expansion , 格式 ${FILE%.*} 是非贪婪匹配，仅仅消除最后一个 . 右侧的字符串。 ${FILE%%.*} 是贪婪匹配会消除如 filename.tar.gz 中的后2位，结果是 filename .
或者用 Shell Parameter Expansion 的字符串替换也可以。需要特别注意的是 shell 中是 大小写敏感 的。
find inputdir -maxdepth 1 -type f -name "*.flac" -exec bash -c 'fin="$0";ffmpeg -hide_banner -i "$0" -t 10 -c:a aac -q:a 1.2 "${fin/%.flac/.m4a}"' {} \;

至当前文件夹不带源文件后缀名

如果要不带 .flac 的输出使用 basename $input .flac 这样的格式，如下。由于使用了 basename ， 不会转换到原文件夹下，需要指定输出文件夹
find input_dir -maxdepth 1 -type f -name "*.flac" -exec ffmpeg -hide_banner -i {} -t 10 -c:a aac -q:a 1.2 outdir/$(basename {} .flac).m4a -y \;
添加水印


水印局中

ffmpeg -i out.mp4 -i sxyx2008@163.com.gif -filter_complex overlay="(main_w/2)-(overlay_w/2):(main_h/2)-(overlay_h)/2" output.mp4
参数解释
-i out.mp4(视频源)
-i sxyx2008@163.com.gif(水印图片)
overlay 水印的位置
output.mp4 输出文件

翻转和旋转

翻转
水平翻转语法: -vf hflip
ffplay -i out.mp4 -vf hflip

垂直翻转语法：-vf vflip
ffplay -i out.mp4 -vf vflip

旋转
语法：transpose={0,1,2,3}
0:逆时针旋转90°然后垂直翻转
1:顺时针旋转90°
2:逆时针旋转90°
3:顺时针旋转90°然后水平翻转
将视频顺时针旋转90度
ffplay -i out.mp4 -vf transpose=1

将视频水平翻转(左右翻转)
ffplay -i out.mp4 -vf hflip

顺时针旋转90度并水平翻转
ffplay -i out.mp4 -vf transpose=1,hflip

添加字幕

有的时候你需要给视频加一个字幕(subtitle)，使用ffmpeg也可以做。一般我们见到的字幕以srt字幕为主，在ffmpeg里需要首先将srt字幕转化为ass字幕，然后就可以集成到视频中了(不是单独的字幕流，而是直接改写视频流)。
ffmpeg -i my_subtitle.srt my_subtitle.ass
ffmpeg -i inputfile.mp4 -vf ass=my_subtitle.ass outputfile.mp4
但是值得注意的是：
my_subtitle.srt需要使用UTF8编码，老外不会注意到这一点，但是中文这是必须要考虑的；
将字幕直接写入视频流需要将每个字符渲染到画面上，因此有一个字体的问题，在ass文件中会指定一个缺省字体，例如Arial，但是我们首先需要让ffmpeg能找到字体文件，不然文字的渲染就无从谈起了。ffmpeg使用了fontconfig来设置字体配置。你需要首先设置一下FONTCONFIG_PATH或者FONTCONFIG_FILE环境变量，不然fontconfig是无法找到配置文件的，这一点请参看这篇文章，如果你设置的是FONTCONFIG_PATH，那把配置文件保存为%FONTCONFIG_PATH%/font.conf即可，然后你可以在font.conf文件中配置字体文件的路径之类的。
Windows下为fontconfig设置如下的环境变量
FC_CONFIG_DIR=C:\ffmpeg
FONTCONFIG_FILE=font.conf
FONTCONFIG_PATH=C:\ffmpeg
PATH=C:\ffmpeg\bin;%PATH%

下面是一个简单的Windows版font.conf文件。
<?xml version="1.0"?>
<fontconfig>

<dir>C:\WINDOWS\Fonts</dir>

<match target="pattern">
   <test qual="any" name="family"><string>mono</string></test>
   <edit name="family" mode="assign"><string>monospace</string></edit>
</match>

<match target="pattern">
   <test qual="all" name="family" mode="not_eq"><string>sans-serif</string></test>
   <test qual="all" name="family" mode="not_eq"><string>serif</string></test>
   <test qual="all" name="family" mode="not_eq"><string>monospace</string></test>
   <edit name="family" mode="append_last"><string>sans-serif</string></edit>
</match>

<alias>
   <family>Times</family>
   <prefer><family>Times New Roman</family></prefer>
   <default><family>serif</family></default>
</alias>
<alias>
   <family>Helvetica</family>
   <prefer><family>Arial</family></prefer>
   <default><family>sans</family></default>
</alias>
<alias>
   <family>Courier</family>
   <prefer><family>Courier New</family></prefer>
   <default><family>monospace</family></default>
</alias>
<alias>
   <family>serif</family>
   <prefer><family>Times New Roman</family></prefer>
</alias>
<alias>
   <family>sans</family>
   <prefer><family>Arial</family></prefer>
</alias>
<alias>
   <family>monospace</family>
   <prefer><family>Andale Mono</family></prefer>
</alias>
<match target="pattern">
   <test name="family" mode="eq">
      <string>Courier New</string>
   </test>
   <edit name="family" mode="prepend">
      <string>monospace</string>
   </edit>
</match>
<match target="pattern">
   <test name="family" mode="eq">
      <string>Courier</string>
   </test>
   <edit name="family" mode="prepend">
      <string>monospace</string>
   </edit>
</match>

</fontconfig>
下面这个是Linux系统下改版过来的
<?xml version="1.0"?>
<!DOCTYPE fontconfig SYSTEM "fonts.dtd">
<!-- /etc/fonts/fonts.conf file to configure system font access -->
<fontconfig>
<!-- 
	Find fonts in these directories
-->
<dir>C:/Windows/Fonts</dir>
<!--
<dir>/usr/X11R6/lib/X11/fonts</dir>
-->
<!--
	Accept deprecated 'mono' alias, replacing it with 'monospace'
-->
<match target="pattern">
	<test qual="any" name="family"><string>mono</string></test>
	<edit name="family" mode="assign"><string>monospace</string></edit>
</match>

<!--
	Load per-user customization file, but don't complain
	if it doesn't exist
-->
<include ignore_missing="yes" prefix="xdg">fontconfig/fonts.conf</include>

<!--
	Load local customization files, but don't complain
	if there aren't any
-->
<include ignore_missing="yes">conf.d</include>
<include ignore_missing="yes">local.conf</include>

<!--
	Alias well known font names to available TrueType fonts.
	These substitute TrueType faces for similar Type1
	faces to improve screen appearance.
-->
<alias>
	<family>Times</family>
	<prefer><family>Times New Roman</family></prefer>
	<default><family>serif</family></default>
</alias>
<alias>
	<family>Helvetica</family>
	<prefer><family>Arial</family></prefer>
	<default><family>sans</family></default>
</alias>
<alias>
	<family>Courier</family>
	<prefer><family>Courier New</family></prefer>
	<default><family>monospace</family></default>
</alias>

<!--
	Provide required aliases for standard names
	Do these after the users configuration file so that
	any aliases there are used preferentially
-->
<alias>
	<family>serif</family>
	<prefer><family>Times New Roman</family></prefer>
</alias>
<alias>
	<family>sans</family>
	<prefer><family>Arial</family></prefer>
</alias>
<alias>
	<family>monospace</family>
	<prefer><family>Andale Mono</family></prefer>
</alias>
</fontconfig>
http://blog.raphaelzhang.com/2013/04/video-streaming-and-ffmpeg-transcoding/
嵌入字幕

在一个MP4文件里面添加字幕，不是把 .srt 字幕文件集成到 MP4 文件里，而是在播放器里选择字幕，这种集成字幕比较简单，速度也相当快
ffmpeg -i input.mp4 -i subtitles.srt -c:s mov_text -c:v copy -c:a copy output.mp4
希望字幕直接显示出来，其实也不难
ffmpeg -i subtitle.srt subtitle.ass
ffmpeg -i input.mp4 -vf ass=subtitle.ass output.mp4

http://blog.neten.de/posts/2013/10/06/use-ffmpeg-to-burn-subtitles-into-the-video/
截图

每隔一秒截一张图
ffmpeg -i out.mp4 -f image2 -vf fps=fps=1 out%d.png

每隔20秒截一张图
ffmpeg -i out.mp4 -f image2 -vf fps=fps=1/20 out%d.png

多张截图合并到一个文件里（2x3）每隔一千帧(秒数=1000/fps25)即40s截一张图
ffmpeg -i out.mp4 -frames 3 -vf "select=not(mod(n\,1000)),scale=320:240,tile=2x3" out.png

从视频中生成GIF图片
ffmpeg -i out.mp4 -t 10 -pix_fmt rgb24 out.gif

转换视频为图片（每帧一张图）
ffmpeg -i out.mp4 out%4d.png

图片转换为视频
ffmpeg -f image2 -i out%4d.png -r 25 video.mp4

添加字幕

ffmpeg -i out.mp4 -vf subtitles=out.srt output.mp4