该接口实际能力及输入格式要求以接口文档为准 横屏视频字幕 横屏视频字幕 音频字幕 参数设置 字幕语种 中文普通话 查看接口文档 > 应用场景 视频编辑工具 视频直播字幕 内容生产平台 网络课堂字幕 在线会议字幕 视频编辑工具 助力打造视频快剪、一键生成字幕等AI字幕功能,大幅节约字幕生产的人力及时间成本,高效完成智能视频创作 特色优势 语音精准识别 基于深度学习技术,打造效果领先的语音识别模型
AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成
该接口实际能力的图片格式及大小要求以接口文档为准 识别结果 请求参数 JSON结果 序号 内容 1 LSGGF53W8CH045613 Params image= 图片的Base64编码 type=https://aip.baidubce.com/rest/2.0/ocr/v1/vin_code Post https://aip.baidubce.com/rest/2.0/ocr/v1/vin_code
帮助您零门槛进行视频创作 个性化视频参数调整 支持调整视频配音音色、视频长度、视频尺寸、添加数字人等参数,满足用户个性化需求 应用场景 新闻宣传 企业宣传 营销推广 知识科普 金融产品介绍 新闻宣传 无需专业视频编辑,仅需上传图文稿件,即可快速生成新闻短视频,实现图文稿件和视频新闻的同步投放 合作案例 技术特色 技术领先 基于百度领先的语言理解、多模态创作技术,实现图文素材智能解析、重组和视频生成
公众人物识别 基于百度人脸识别技术和丰富全面的公众人物库,识别视频中出现的明星、名人,以及人物出现的时间位置和区域等信息。 Logo识别 识别视频节目中出现的logo,如车标、台标等标识,可用于影视剧、综艺等节目素材分析。 知识图谱 基于影视、综艺诗词等各垂类知识图谱,结合知识计算、推理技术,联想出与媒资高度相关的标签。
该接口实际能力的图片格式及大小要求以接口文档为准 识别结果 请求参数 JSON结果 号牌号码 京AA5599 车辆类型 小型轿车 所有人 王京 住址 北京市石景山区 使用性质 非营运 品牌型号 讴歌牌GHA7150JAD5B 车辆识别代号 HHGHH555778802669 发动机号码 112244 注册日期 20180614 发证日期 20180614 发证单位 北京市公安局公安交通管理局 输出字段归一化
办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本、印章、栏、页眉、页脚和脚注等位置和分版块内容的OCR识别结果,支持表格识别,印章识别和单字置信度输出,支持中、英、日、韩、法等 20+ 语言类型,手写、印刷体混排多种场景 HOT 精准识别文档内容与布局,支持转换为Word、Excel、双层PDF等格式,立即体验 > 立即使用 技术文档 产品价格 私有化部署 商务咨询 功能介绍
表格文字识别 支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。
园区管理等场景 方案介绍 申请免费试用 软硬一体方案 基于EdgeBoard硬件,内置人体属性识别、检测算法,可离线本地化部署,软硬一体效果佳 立即购买 使用文档 即刻免费体验人体检测与属性识别能力 公有云API最高可享5 QPS,50000次免费测试调用 立即使用 相关推荐 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 人流量统计
该接口实际能力的图片格式及大小要求以接口文档为准 识别结果 请求参数 JSON结果 车票号 F067846 始发站 北京南站 车次号 C2565 到达站 天津站 出发日期 2019年04月03日 座位号 02车03C号 车票金额 ¥54.5元 席别 二等座 乘客姓名 裴瑜丽 身份证号 2302051998****156X 售站 北京南 序列号 10010301110403F067846 时间 09: