音视频处理MCT

    功能特性

    MCT音视频处理服务的核心能力特性如下所示:

    转码格式

    类别 说明
    输入格式 · 封装格式:MP4、FLV、MOV、M3U8、3GP、AVI、MPG、ASF、WMV、MKV、TS、WebM、MXF;
    · 视频编码格式:H.264/AVC、H.265/HEVC、MPEG-1、MPEG-2、MPEG-4、MJPEG、VP8、VP9、Quicktime、RealVideo、Windows Media Video ;
    · 音频编码格式:AAC、AC-3、ADPCM、AMR、DSD、MP1、MP2、MP3、PCM、RealAudio、Windows Media Audio
    输出格式 · 视频封装格式:FLV、MP4、HLS(m3u8+ts)、MPEG-DASH(MPD+fMP4);
    · 音频封装格式:MP3、MP4、OGG、FLAC、m4a;
    · 图片封装格式:JPG、PNG、GIF、WEBP;
    · 视频编码格式:H.264/AVC、 H.265/HEVC;
    · 音频编码格式:MP3、AAC、VORBIS、FLAC

    视频编码

    参数 说明
    codec 编码标准:h264、h265,默认为h264
    profile 编码级别:baseline, main, high,默认为baseline,h265只支持main
    bitRateInbps 目标码率,范围[100, 50000],单位kbps
    maxFrameRate 最大帧率,选项为:10,15, 23.97, 24, 25, 29.97, 30, 50, 60
    maxWidthInPixel 分辨率的宽,范围[128,4096]
    maxHeightInPixel 分辨率的高,范围[96,3072]
    sizingPolicy 伸缩策略,包括:
    · Keep:当源视频宽高均小于模版宽高时,保持源视频分辨率不变;当源视频的宽或高大与模版时,长边缩小至与模版一致,另一边等比例缩放。
    · shrinkToFit:保持原始视频宽高比并加黑边以达到模版的分辨率;
    · shrinkToFitBlur:保持原始视频宽高比并加高斯模糊效果以达到模版的分辨率;
    · stretch:表示拉伸原始视频,以达到模版分辨率。
    crf 码率控制策略:
    · 默认为VBR;
    · 可设定恒定质量crf,范围 [1, 51]
    playbackSpeed 倍速播放:范围 [0.05,20.0]
    · 低于1.0时为减速播放;
    · 高于1.0时为加速播放。
    transMode 转码模式,支持:normal、twopass、cae(智感超清)

    音频编码

    参数 说明
    codec 默认为AAC
    bitRateInBps 目标码率,范围 [0,1000]
    ampleRateInHz 音频采样率,选项:22050, 32000, 44100, 48000, 96000
    channels 音频声道数,选项:1, 2
    gain 音量大小,范围[-60,60],单位db,值为负调小音量,值为正调大音量。
    mute 是否静音
    norm 是否进行音量归一化,避免音量忽高忽低

    视频编辑

    功能 说明
    视频拼接 最多支持200个视频拼接成1个
    视频剪辑 支持设置起始时间、持续时长,单位为秒或毫秒
    去水印 支持设置去水印的区域(x、y、width、height)
    去黑边 支持设置裁剪黑边后的有效画面区域(x、y、width、height),支持自动检测黑边区域
    高斯模糊 支持动态高斯模糊效果填充
    叠加静态/动态水印 格式包括:jpg、png、apng、gif、webp、mov、mp4等,支持设置显示位置和起始时间
    叠加字幕 支持srt字幕文件;支持设置字体、字号、显示位置和起始时间
    叠加音频 支持音频格式包括mp3、aac等

    视频截图

    功能 说明
    指定
    截图
    · manual:按指定的起止时间和间隔时间截取缩略图;
    · split:按指定的起止时间和张数截取缩略图;
    · splitss0:在split模式的基础上保证截取首帧
    智能
    截图
    · auto:自动截取熵值较高的一帧;
    · shot:根据场景切换自动截取转场画面帧;
    · idl:使用百度IDL(Institute of Deep Learning)智能缩略图算法截取一帧缩略图;
    · highlight:根据AI模型,自动生成一个0.5s精彩片段,可设置截取时长
    雪碧图 可指定雪碧图的行、列、外框宽度、子图间隔
    图片
    格式
    · 静态图片格式:jpg、png
    · 动态图片:gif、webp、mp4
    · 动态图片支持设置帧率和播放倍速
    图片
    宽高
    宽/高范围 [10,2000],宽默认600,高默认450,若视频实际分辨率低于目标分辨率则按照实际分辨率输出
    伸缩
    策略
    · keep表示保持原始视频宽高比;
    · shrinkToFit表示保持原始视频宽高比并加黑边;
    · stretch表示拉伸原始视频
    去水印 可指定去水印的模糊区域(x、y、width、height)
    黑边
    剪裁
    可指定去黑边后的有效画面区域(x、y、width、height),支持自动黑边区域检测

    媒体信息

    类别 说明
    文件信息 包括:文件大小、文件时长、容器格式、文件类型、MD5值
    视频信息 包括:编码标准、分辨率(宽/高)、码率、帧率
    音频信息 包括:编码标准、声道、采样率、码率

    视频加密

    加密模式 说明
    fixed 固定密钥加密,使用用户指定的密钥对视频进行加密,此时需要aesKey;
    open 开放密钥,系统自动生成加密密钥,密钥公开,不设访问控制;
    playerBinding 系统自动生成加密密钥,密钥设有访问控制,绑定播放器,安全性比较高,推荐。

    智感超清

    类别 说明
    智感超清1.0 对视频场景级别的画面复杂度进行智能分析,动态分配最优编码参数,同等画质下,码率更低,从而节省带宽成本和存储成本。
    智感超清2.0 以人眼主观体验最好为目标,对画面的颜色、亮度、对比度、饱和度等调优,强化人眼关注区画面质量,节省码率的同时,提高画面质量。
    老片修复 针对老片或过度压缩的视频,去除抖动、划痕、噪点、马赛克等,提高画面清晰度。智感超清2.0的垂直应用场景。
    智能插帧 对于30帧/秒及以内的普通帧率视频,生成60帧/秒甚至120帧/秒的高帧率版本,提高画面流畅度,一般配合超分使用。
    超分辨率 利用深度学习模型,提升视频画面的细节,将低分辨率重建至高分辨率,例如:SD转HD 、2K转4K等。
    上一篇
    名词解释
    下一篇
    产品优势