表、标题、文本的位置,并输出分版块内容 了解详情 表格文字识别 对单据或报表中的表格内容进行结构化识别,并以JSON或Excel形式返回 了解详情 印章识别 检测并识别合同文件或常用票据中的印章,已支持圆形章、椭圆形章、方形章等常见印章 了解详情 手写文字识别 支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上 了解详情 二维码识别 对二维码、
包括视频创作、智能写作等多模态创作能力,能够极大地提高内容生产效率 PPT转视频 一键解析PPT素材,自动编排文字和图片信息,并加入配音及字幕,配以各类转场动画,形成生动有趣的图文解说视频 图文素材转视频 输入图文素材,一键自动生成视频,适用于企业宣传、营销推广、知识科普等场景,帮助创作者快速实现图文转视频
支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化
帮助您零门槛进行视频创作 个性化视频参数调整 支持调整视频配音音色、视频长度、视频尺寸、添加数字人等参数,满足用户个性化需求 应用场景 新闻宣传 企业宣传 营销推广 知识科普 金融产品介绍 新闻宣传 无需专业视频编辑,仅需上传图文稿件,即可快速生成新闻短视频,实现图文稿件和视频新闻的同步投放 合作案例 技术特色 技术领先 基于百度领先的语言理解、多模态创作技术,实现图文素材智能解析、重组和视频生成
公众人物识别 基于百度人脸识别技术和丰富全面的公众人物库,识别视频中出现的明星、名人,以及人物出现的时间位置和区域等信息。 Logo识别 识别视频节目中出现的logo,如车标、台标等标识,可用于影视剧、综艺等节目素材分析。 知识图谱 基于影视、综艺诗词等各垂类知识图谱,结合知识计算、推理技术,联想出与媒资高度相关的标签。
264 }, { classname : Face , top : 163 , left : 810 , probability : 0.6906901597976685 , width : 208 , height : 238 } ], result_num : 2 , log_id : 1879006793925340200 } 应用场景 智能家居 视频直播
并结构化返回关键字段识别结果,能够满足对不同种类金融单据进行信息提取的需求 效果领先 针对各类金融单据据特定的字体、打印样式专项优化,关键字段准确率可达90%以上 使用方式 公有云服务 提供各类文字识别的云端接口,可直接调用API或使用HTTP SDK对图片中的文字进行识别 API文档 私有化部署 部署至本地服务器或专有云服务器,在局域网/内网中实现文字识别功能,保障数据私密性,提供一体机和软件部署包两种私有化方案
合作案例 特色优势 字段齐全 可快速结构化识别常用差旅票据的所有字段,信息丰富,选择多样,充分满足各类业务场景需求 效果领先 针对各类票据特定的字体、打印样式专项优化,关键字段准确率高达98%,其中出租车票四要素准确率高达99.9% 产品价格 共享资源包 专项资源包 按量后付费 私有化部署 共享资源包 适用于调用量可预估、多接口同时使用的企业/个人,计费调用量扣费顺序:专项资源包 >共享资源包
效果领先 针对各类票据特定的字体、打印样式专项优化,关键字段准确率高达98%,其中增值税发票、出租车票四要素准确率高达99.9% 能力全面 提供增值税发票验真能力,接入国税发票查验平台权威数据源,结合各项票据识别能力,一站式解决财务场景的分类、识别及验真需求 使用方式 公有云服务 提供各类文字识别的云端接口,可直接调用API或使用HTTP SDK对图片中的文字进行识别 API文档 私有化部署 部署至本地服务器或专有云服务器
输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持表格识别和印章识别 iOCR通用版 结合多项图像处理技术,对各类票据卡证自动分类,并实现结构化识别 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化