公众人物识别 基于百度人脸识别技术和丰富全面的公众人物库,识别视频中出现的明星、名人,以及人物出现的时间位置和区域等信息。 Logo识别 识别视频节目中出现的logo,如车标、台标等标识,可用于影视剧、综艺等节目素材分析。 知识图谱 基于影视、综艺诗词等各垂类知识图谱,结合知识计算、推理技术,联想出与媒资高度相关的标签。
帮助您零门槛进行视频创作 个性化视频参数调整 支持调整视频配音音色、视频长度、视频尺寸、添加数字人等参数,满足用户个性化需求 应用场景 新闻宣传 企业宣传 营销推广 知识科普 金融产品介绍 新闻宣传 无需专业视频编辑,仅需上传图文稿件,即可快速生成新闻短视频,实现图文稿件和视频新闻的同步投放 合作案例 技术特色 技术领先 基于百度领先的语言理解、多模态创作技术,实现图文素材智能解析、重组和视频生成
264 }, { classname : Face , top : 163 , left : 810 , probability : 0.6906901597976685 , width : 208 , height : 238 } ], result_num : 2 , log_id : 1879359920590361600 } 应用场景 智能家居 视频直播
支持扫描和拍照场景,支持印刷、手写文字的分类与识别,支持公式识别 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化,识别准确率可达90%以上
gt; 立即使用 技术文档 产品价格 私有化部署 商务咨询 功能介绍 功能演示 应用场景 产品价格 使用方式 支持交流 相关推荐 功能介绍 全字段识别 支持对增值税普票、专票、卷票、区块链发票、全电发票全部关键字段的结构化识别,能够满足财税报销等场景中对任意字段的识别需求 二维码识别校验 识别票面左上角的二维码,获取发票代码、号码、金额、开票日期、校验码五个字段信息,与识别到的对应字段信息进行匹配校验
公有云API最高可享3W次免费测试资源 立即使用 相关推荐 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成 通用物体和场景识别 可识别超过10万类常见物体和场景,接口返回大类及细分类的名称,并支持获取识别结果对应的百科信息 地标识别 可识别超过12万中外著名地标、景点,广泛应用于拍照识图、幼教科普、图片分类等场景
通用文字识别 多场景、多语种、高精度的整图文字检测和识别服务,可识别中、英、日、韩、法、俄、西、葡、德、意等20+种语言 iOCR通用版 针对固定版式的卡证票据可由用户自助创建识别模板和分类器,实现图片的自动分类及结构化识别 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体进行专项优化,识别准确率可达90%以上
驾驶证识别 结构化识别机动车驾驶证正页及副页所有15个字段,包括证号、姓名、住址、初次领证日期、准驾车型等。同时支持识别交管12123 APP 发放的电子驾驶证正页,包括证号、姓名等全部15 个字段 新客 驾驶证识别低至 4.5元 ,售完即止!
包括各类印刷和手写文档、网络图片、表格、数字、二维码等 教育场景文字识别 对教育场景中所涉及的教材、试卷等文档进行识别,可识别公式、手写文字、题目等内容 网络图片文字识别 针对网络图片专项优化,识别艺术字体或背景复杂的文字内容,可返回文字的位置信息、行置信度、单字符内容和位置等 试卷分析与识别 对试卷、教材等内容进行整页识别,支持扫描和拍照场景,支持印刷、手写文字的分类与识别,支持公式识别 手写文字识别
公有云API最高可享1000次免费测试资源 立即使用 相关推荐 通用文字识别 多场景、多语种、高精度的整图文字检测和识别服务,多项ICDAR指标居世界第一,可识别20+种语言 手写文字识别 检测识别图片中的手写中文、手写数字,针对不规则的手写字体专项优化,手写中文识别准确率可达90%以上 数字识别 识别提取图片中的数字信息,自动过滤非数字内容,仅返回数字内容及其位置信息,识别准确率超过99%