功能发布记录 短视频SDK 发布时间 功能概述 2022-09 1.SDK支持arm64位系统 2.优化SDK架构 2020-12 1.增加接入文档预览和版本 2.支持1:1及4:3比例拍摄 3.支持预置相机拍摄水印 2020-09 1.美妆贴合精准度优化,人像分割/头发分割效果优化 2.新增人脸单帧图片处理(贴纸、美妆、滤镜) 3.引擎升级动力学效果,包括重力感和碰撞检测,如软绳、金属链 2020
推流参数配置 LiveConfig用于配置视频采集/编码参数、音频采集/编码参数、及推流参数配置等。 视频采集/编码配置信息包括: 前后置摄像头:设置初始化拍摄器时使用前置或后置相机。 摄像头旋转角度:设置摄像头方向。 视频分辨率:视频采集及编码分辨率,视频编码场景中分辨率与清晰度正相关。 视频帧率:视频采集及编码帧率,视频编码场景中帧率与画面连贯正相关。
解决方案 针对上述痛点,朗知传媒了解到百度智能创作平台具备图文转视频的能力,可以支持图文内容一键生成视频,还可以支持基于文字、URL、视频、图片等智能化的快速生成短视频。在生成过程中通过智能算法分析海量文本与图片内容,并在分析后动态生成视频内容,在大数据与算法加持下提炼出用户更为喜欢的视频内容,节省传统人工剪辑的成本,补齐朗知短视频批量生产的短板。
智能结构化识别 该接口已停止更新且即将下线,为避免影响您目前的业务使用,请您及时进行相关迁移工作 接口描述 结构化识别各类卡证、票据,无需配置结构化对应关系、无需提取关键词、无需定制开发,直接上传图片即可获得结构化识别信息。
通用票据识别 该接口已停止更新且即将下线,如需更好的识别效果,请使用 智能财务票据识别 ,此服务支持财务场景中13种常见票据的分类及结构化识别,支持多张不同种类票据在同一张图片上的混贴场景,可返回每张票据的位置、种类及票面信息的结构化识别结果。您也可以选择使用 通用文字识别(高精度版) ,提供更高精度的识别服务,同时支持多语种识别。
即章内上环弯曲文字结果 ++probability 否 float 主字段识别内容的置信度 +minor 否 array[] 印章内其他字段信息,即除主字段外的识别内容均放置于该参数中返回,若章内不存在其他字段则该参数为空 ++words 否 string 其他字段识别内容 ++probability 否 float 其他字段识别内容的置信度 formula_result 否 array[] 识别到的公式数组
PDF文件的对应页码,当 pdf_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页 probability 否 true/false - 是否返回字段识别结果的置信度, 默认为 false,可缺省 - false: 不返回字段识别结果的置信度 - true: 返回字段识别结果的置信度,包括字段识别结果中各字符置信度的平均值(average)和最小值(min) 请求代码示例
港澳通行证识别 该接口的公有云服务即将下线,若您仍需要识别港澳通行证,您可以选择使用 港澳台证件识别 接口。此接口功能和效果更佳,支持识别4类港澳台出入境证件识别,包含港澳通行证正/反面、台湾通行证正/反面、台胞证(台湾居民来往大陆通行证)正/反面、返乡证(港澳居民来往内地通行证)正/反面,同时支持识别以上4类证件的全部字段信息。
ofd_file,当image、url、pdf_file字段存在时,ofd_file字段失效 ofd_file_num 否 string - 需要识别的OFD文件的对应页码,当 ofd_file 参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页 probability 否 string true/false 是否返回字段置信度,默认为 false ,即不返回 location
视频流转码 用户可以在实时播放页面选择播放转码流。 完成创建模板,参考 转码模板 文档 完成空间转码配置,参考 空间转码配置 文档 选择一个设备,点击实时观看,选择想播放的转码流,即开始视频流转码,此时播放的就是转码后的视频流