解决方案 政务智能审批平台通过集成百度大脑iOCR自定义模板文字识别和通用文字识别技术,对用户提交的图片材料中的文字信息进行结构化识别。同时将提取出的结构化信息,与申请事项预设的规则,进行自动化比对与校验。提高了审批人员的审批效率和准确性。
使用产品 千帆大模型 通用文字识别 大模型语音合成 支持与交流 AI社区 教学视频 文档中心 SDK下载 AI助力考试宝打造大模型时代职业教育“AI大脑” 价值成果 考试宝成功整合了百度智能云千帆大模型和OCR文字识别技术,为在线考试平台注入了强大动力。通过推出拍照搜题功能,并优化试题解析等服务,考试宝成功构建了大模型时代职业教育领域的“AI大脑”。
接口能力 接口名称 接口能力简要描述 语音识别 采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景。 短语音识别 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
使用产品 文字识别 图像审核 文本审核 色情识别助力保障美团点评内容安全 生活服务 美团点评是中国领先的生活服务电子商务平台,公司拥有美团、大众点评、美团外卖、美团打车、摩拜单车等消费者熟知的App。 使用产品 图像审核 AI技术推动内容智能化管理 软件工具 惠头条是为用户推荐有价值、个性化的内容资讯。
序号 部署包模型 显存占用 单显卡QPS承载量(以P4卡为例) 说明 1 人体关键点识别 5.2G 25~35 QPS 与图片中的人数有关,图片中人越多,单卡支持的QPS数量越少 2 人体检测 2G 45~50 QPS 与图片中的人数有关,图片中人越多,单卡支持的QPS数量越少 3 人体属性识别(单人版) 2.3G 80 QPS 仅针对单人图片进行识别,需搭配人体检测模型使用 4 人流量统计 5G
使用产品 文字识别 图像审核 文本审核 百度内容审核助力语音口令过滤垃圾内容 软件工具 语音口令是基于微信小程序平台的一款社交红包类小程序,凭着新奇的玩法和小程序作为载体的便利性,语音口令在上线后一个月内就裂变了20万的使用用户。 使用产品 文本审核 AI技术推动内容智能化管理 软件工具 惠头条是为用户推荐有价值、个性化的内容资讯。
使用产品 菜品识别 AI智能图像识别 口袋里的健康营养师 软件工具 识菜君是一款可以随手拍照识别蔬菜营养元素的小程序,由深圳市微尚互动科技有限公司通过“百度AI图像识别技术”+“大健康养生理念”+“小程序”研发出品,旨在为用户提供蔬菜的营养价值、搭配禁忌、适宜人群及菜谱制作等智慧化推荐服务。
在业内的识别速率也是首屈一指,当人站在黄线外刷脸到完全通过闸机只需1.8秒,而使用地铁卡、手机二维码等方式需3秒才可通过闸机,乘客通行速度提升了近一倍 使用产品: 人脸离线识别SDK 人脸识别私有化部署包 明镜实名认证解决方案 查看详情 OCR 让快递下单高效便捷 寄件人上传订单截图,一键录入收/发件人信息,自动进行地址补全。
音频文件转写极速版API-邀测 接口描述 支持提取视频、音频文件中的语音内容,极速返回识别结果及时间戳,适用于对实时性有一要求的内容分析、字幕生产、录音转写场景。
通过编写代码调用语音技术服务 API 如果您是开发工程师,熟悉代码编写,您可以通过编写代码的方式调用文字识别服务。具体请参见 如何用代码调用 。 通过软件开发工具包(HTTP-SDK)调用语音技术服务 如果您是开发工程师,熟悉代码编写,您可以通过已编写好的软件开发工具包(HTTP-SDK)来调用文字识别服务 API 。