伸缩策略 是 提供3种伸缩策略:(Kepp)保持原视频尺寸比率、(ShrinkToFit)自适应伸缩、(Stretch)拉伸原视频尺寸。默认(Kepp)保持原视频尺寸比率。 抽帧格式 是 表示抽帧输出缩略图的格式。提供5种选择:JPG、PNG、MP4、GIF、WEBP。默认JPG。 抽帧模式 是 表示抽帧的策略。
d) 是百度智能云 BCE (Baidu Cloud Engine) 提供的面向音视频点播的 PaaS (Platform as a Service) 服务平台,为开发者提供音视频文件的存储、管理及播放服务。您无需了解音视频的后台处理,即可快速搭建安全可靠、高可定制的点播平台和应用。
2025-03 上线 视频生成: VOD平台视频生成计费项正式上线,支持预付费、后付费多种模式 视频生成计费项 2025-02 上线 视频生成:VOD平台上线视频生成能力,视频生成API全面上线,媒资库、媒资处理、任务中心、回调配置全面融合视频生成能力 视频生成相关接口 2025-01 上线 新版VOD平台计费项上线 VOD计费项 2024-10 上线 VOD平台API全面上线 VOD相关接口 2024
计费概述 重要通知: 自2024年11月20日起,本产品计费项组成和计费项名称进行更新,详情说明请参见下文; 自2024年11月20日起,本产品对外正式计费的有:存储、标准音视频转码、AI音画质重生(智感超清)、AI视频质量检测、媒体版权保护、分发。 计费项组成 计费方式 智能点播平台目前提供一种计费方式:后付费。 后付费 根据您的使用情况,各计费项单独计量计费,不使用不计费。
音视频质量检测计费项 定价 音视频问题检测 计费项 单价(元/分钟) 视频问题检测 0.08 音频问题检测 0.03 计费规则 费用计算公式:费用 = 输入待检测文件时长 ✖️ 单价 付费方式:后付费 输入规格:不区分输入视频规格,统一价格。 详细价格信息,请参见“ 智能点播平台价格说明 ”。
OCR识别 OCR(Optical Character Recognition)能力基于深度学习图像识别模型,可从图片或视频内容中自动识别文字信息,支持从文档、屏幕截图、广告牌等媒资中提取文字内容,并产出结构化文本。本能力可广泛应用于文档解析、字幕生成、内容审核、文本搜索等场景。 每次调用输入一个媒资(图片 / 视频),输出识别出的文字内容。目前支持视频和图片OCR 1.
媒资通用处理 本接口用于对VOD的媒资发起处理任务,功能包括: 指定工作流发起媒资处理,工作流节点可以包括: 转码 抽帧 视频黑边检测 字幕提取 视频内容分析(提取人物、场景等标签、分类) 视频内容审核(涉黄、暴恐、涉政、违禁、广告等) 指定转码模板发起转码 转码时可以指定明水印、数字水印 指定抽帧模板发起抽帧 指定视频多样化模版发起视频多样化 发起处理任务后,VOD会生成一个相关的任务ID,可通过任务
对口型 本接口用于创建对口型任务 注意事项: P 模型注意事项 支持 .mp4 或 .mov 视频文件,最大分辨率:1920p,文件大小不超过50MB,视频时长不超过30s 支持 .mp3 或 .wav 音频文件,文件大小不超过50MB,视频时长不超过30s K 模型注意事项 K 模型视频文件支持.mp4/.mov,文件大小不超过100MB,视频时长不超过10s且不短于2s,仅支持720p和1080p
查询翻译任务详情 由于视频翻译任务为工作流任务,其中包含多个子节点,因此通过此接口不仅能获取最终翻译结果的URL(合成节点产出),还能获取中间结果,例如源视频字幕SRT(视频理解节点产出)、翻译后的字幕SRT(翻译节点产出)以及擦除后视频URL(转码节点产出)。具体参考 查询任务详情
示例 拉取上传视频 拉取一个视频到VOD,请求如下,其中 url 为需要拉取的视频文件URL,拉取成功后可以通过响应的taskId查询到拉取任务生成的mediaId,该media的名称将会是 demo 。