核心功能
功能说明
媒资上传
VideoWorks的文件上传依赖于BOS,借助BOS的强大文件上传能力,为您提供了丰富的文件上传方式。
我们提供了多种音视频文件上传方式,包括:console、API、SDK(Java、Python、PHP、C#、Android等)。根据上传数据的大小,我们提供了两种方式:单文件上传(可上传最大5GB的单文件数据)、分块上传(可上传最大5TB的单文件数据),其中分块上传具备如下优势:
- 提高吞吐量:用户可以并行上传分块以提高吞吐量。
- 从网络问题中快速恢复:分块上传支持断点续传,可以将由网络错误而导致的上传产生的影响减至最低。
- 不需要确认Object的大小:在分块上传的场景下,用户可以不用关心Object的大小以及大小可能带来的上传失败场景。
-
支持流式上传文件。
备注:详情请见BOS-上传object。
此外,我们还提供了bce-bos-uploader工具帮助您实现客户端直传BOS。bce-bos-uploader是百度智能云基于Javascript SDK开发的一个ui组件,为了方便用户开发web直传应用而专门提供的,使用该工具用很少的几行代码就可以完成跟BOS服务的对接,详情请见BOS-Web端直传实践。
视频存储
百度对象存储BOS(Baidu Object Storage)提供稳定、安全、高效以及高扩展存储服务,支持单文件最大5TB的文本、多媒体、二进制等任何类型的数据存储。数据多地域跨集群的存储,以实现资源统一利用,降低使用难度,提高工作效率。"存储+计算框架"让您的数据加上“动力”引擎,让数据在传输、存储、处理和发布4个环节有机融为一体。
详情请见对象存储BOS。
视频处理
VideoWorks集成了音视频处理MCP(Multimedia Cloud Processing),基于视频转码能力,提供丰富的PAAS和SAAS视频处理工具。
类别 | 说明 |
---|---|
视频转码 | · 支持封装格式:MP4、FLV、MOV、M3U8、3GP、AVI、MPG、ASF、WMV、MKV、TS、WebM、MXF; · 支持视频编码格式:H.264/AVC、H.265/HEVC、MPEG-1、MPEG-2、MPEG-4、MJPEG、VP8、VP9、Quicktime、RealVideo、Windows Media Video; · 支持音频编码格式:AAC、AC-3、ADPCM、AMR、DSD、MP1、MP2、MP3、PCM、RealAudio、Windows Media Audio。 |
智能封面 | 支持6种模式抽帧: · 自动截取熵值较高的一帧; · 根据场景切换自动截取转场画面帧; · 使用百度IDL(Institute of Deep Learning)智能缩略图算法截取一帧缩略图; · 根据AI模型,自动生成一个0.5s精彩片段,可设置截取时长; · 按指定的起止时间和间隔时间截取缩略图; · 按指定的起止时间和张数截取缩略图; · 支持动态图和静态图。 |
视频压缩 | 用户可根据产出文件大小的需求和画质的容忍度,支持4种不同画质的文件大小压缩:流畅(360p)、标清(480p)、高清(720p)、超清(1080p)。 |
视频提升清晰度 | 支持4种不同画质的提升:分辨率不变画面增强、高清720p、超清1080p、超高清4k。 |
智能去水印 | 智能去水印工具能自动/手动去除水印logo,包括:静态Logo、固定位置的动态Logo、半透明Logo、镂空Logo,可以还原被Logo遮挡部分的画面,实现智能图像填充。 |
智能横转竖 | 通过目标检测算法识别出画面中的重要人物和精彩区域,并对运动物体进行跟踪,动态调整窗口位置的方式将视频一键横屏竖屏相互转换。 |
智能去字幕 | ·支持自动识别对白字幕的区域,并擦除视频中的字幕,高度还原被字幕遮挡的画面; ·支持识别中英文字幕内容、各种常见字体样式以及各种常见字幕特效并去除。 |
智能去抖动 | 支持由于设备采集造成视频画面抖动的现象时,根据用户需要小幅调整每帧图像以形成平滑稳定的画面。 |
详情请见音视频处理MCP。
视频生产
VideoWorks结合百度强大AI识别技术和云端视频合成渲染能力,提供丰富的智能生产PAAS和SAAS工具。
类别 | 说明 |
---|---|
H5快编/合成渲染 | ·基于H5实现,兼容主流浏览器; ·支持视频轨、音频轨、字幕轨、贴图轨多轨操作是,轨道操作支持剪切、复制、粘贴、删除、撤销、重做等; ·支持多种字幕、背景音乐、贴图、转场等资源; ·支持对视频翻转、旋转、裁剪等画面调节;支持对画面滤镜调节、淡入淡出等转场特效设置;支持视频音量大小调整、支持视频整体速度调节; ·支持一键智能生成字幕和智能生成配音功能; ·支持所有用户都能看到组内资源及人物状态; ·字幕轨支持普通字幕、标题字幕、动态字幕多种格式,支持对字幕文字进行大小、字体、颜色、样式、时长配置; ·支持动态、静态贴图覆盖视频,支持对贴图位置、大小、方向的拖动编辑等; ·支持异步提交云端渲染合成任务,可实现提交任务的同时继续编辑任务,无需刻意等待; ·支持根据需求选择三种清晰度的合成效果:标清540P/高清720P/全高清1080P。 |
智能模板 | ·提供100+个不同类型的横版/竖版视频模版,支持替换背景、音乐、贴图等素材后一键生成短视频; ·支持自定义视频模版,提供可视化工具供编辑人员自定义视频模版,保存为模版文件后,可放入模版库里共享使用。 |
智能字幕 | 智能识别视频、音频中的声音并转化为字幕文件.srt。支持中英文双语识别。 |
语音快剪 | 基于语音识别的文本结果,自定义删除字/词/句从而剪除被联动的视频片段。 |
人脸驱动说话 | 通过一张人脸照片,一段语音独白,即可实现照片人脸说话功能。 |
人脸融合/替换 | 通过快速精准地定位人脸关键点,将用户上传的照片与特定形象进行面部层面融合,使生成的图片同时具备用户与特定形象的外貌特征,支持单脸、多脸、选脸融合。 |
人像分割 | 人像人体识别检测后,去掉背景部分,将人体部分分割出来,生成mov视频,用于后续的剪辑制作。 |
智能剪辑 | 通过智能AI识别视频画面的方式自动剪辑,支持通过选择识别画面标签、自定义画面标签优先级自定义剪辑规则,同时通过镜头理解、语义分析保证生成内容的连贯性。帮助后期剪辑人员减少大批量重复性剪辑工作,提高后期生产效率。 |
媒资管理
VideoWorks基于媒体内容审核VCR和媒体内容分析MCA产品,为用户提供智能媒资管理平台,解决传统媒资编目体系文件由于体量大,内容错综复杂的原因难管理,难分类的痛点。为广电传媒、在线教育、媒资版权交易平台提供可视化的智能管理中台。
类别 | 说明 |
---|---|
智能入库 | 通过智能审核功能,将入库媒资提前自动过滤,审核内容包括但不限于: ·暴恐审核:精准识别图像中是否包含杀人流血场景、暴恐袭击场景、恐怖分子头目照片、恐怖组织的旗帜、暴力行为等内容,准确率可达94%以上;避免产品涉及暴恐风险; ·涉政审核:精准识别图像中的政治人物,最小识别人脸80px*80px,保持高准召;利用文字和音频审核,规避财经类股评里提及政治敏感问题; ·在广告审核方面:精确识别各类形式广告,通用LOGO库数量超2万,基于庞大品牌库的基础上,规避恶意/非法广告投放; ·违禁审核:准确识别各类违禁品,如器官变卖、毒品等,避免产品涉及违禁品风险。 详情请见媒体内容审核VCR |
智能编目 | ·支持媒资版权信息、使用记录信息的溯源查看; ·支持智能媒资分析功能,将入库媒资通过AI图像识别/音频识别打上智能标签并分类。 详情请见媒体内容审核MCA |
智能搜索 | 支持关键字检索、图片检索、语音检索。 |
工作流
VideoWoks提供了灵活的工作流能力,用户可以通过控制台可视化的进行工作流的配置。媒资上传完成后指定某个工作流,即可按照工作流设定的执行节点处理直至结束,大大降低了不同任务多次调用的复杂性,可更加灵活的应对不同业务的处理流程需求。工作流支持串行/并行设置,当前支持的处理节点类型包括:
- 输入:必选项;
- 转码:可设置不同转码模版节点,转码出不同清晰度的视频,用于多码率播放;
- 缩略图:支持7种截图模式的设置;
- 黑边检测:支持对视频进行自动黑边区域检测,后续节点一般设置为转码,可进行自动黑边裁剪;
- 元信息提取:支持自动提取分辨率、码率、大小、格式等多项媒体元信息;
- 源文件发布:支持源文件不经过转码/审核等任何处理,直接发布播放;
- 智能审核:配置审核模版后,自动对视频内容进行审核,并返回审核结果;
- 发布:必选项,可设置整体工作流处理完成的消息通知,当配置了智能审核节点,可在发布节点设置自动封禁。
视频分发
内容分发网络CDN(Content Delivery Network)将源站内容分发至遍布全国的加速节点,缩短用户查看内容的延迟,提高用户访问网站的响应速度与网站的可用性,解决网络带宽小、用户访问量大、网点分布不均等问题。百度智能云CDN线路接入电信、联通、移动、广电、铁通、鹏博士、华数、BGP等网络,节点覆盖全国30多个省市,为用户提供可靠的服务。
- 图片鉴黄:CDN图片鉴黄是百度基于云计算平台,通过对海量数据进行快速扫描,来检测出通过CDN加速的图片是否涉黄,能够帮助用户节省90%以上的人力审核成本。
- 访问安全:支持设置refer/IP黑白名单、URL高级鉴权、设置IP访问限频、配置单请求响应限速、多用户访问权限控制、跨域访问等。
详情请见内容分发网络CDN。
视频播放
百度智能云提供Web、Android及iOS平台的播放器SDK,为开发者提供简单、便捷的开发接口,帮助开发者在各类终端设备上实现媒体播放功能。
- 支持目前所有主流的媒体格式播放(mp4、avi、wmv、flv、mkv、mov、rmvb等),以及支持多种格式文件渐进式和流式播放(HLS、RTMP、HTTP Pseudo-Streaming等)。
- 性能强大、功能丰富:CPU/内存占用率低,视频加载速度快、卡顿率低。支持预取、边播边存、多码率无缝切换、拖动实时显示缩略图等高级功能。
- 低门槛、高灵活度实现播放功能:提供了与系统播放器MPMoviePlayerController高度相似的调用接口,便于开发者快速开发媒体播放应用,同时提供开发示例。
- 版权保护:与MCT视频加密相结合,支持HLS加密视频的离线下载和解密播放。
详情请见播放器SDK文档。