登录/注册 个人中心 消息中心 退出登录 插件市场 智慧图问 智慧图问 百度智能云千帆社区 2023.09.15 17917 1 前往使用 使用说明 智慧图问 插件功能 图片解析插件,主要功能为图片理解与识别,并对图片内容进行总结概述,输出用户可理解的自然语言文本描述(句子或段落)。 识别能力包含文字OCR解析、人物识别、植物识别、商品识别、车辆识别等等。
使用产品 iOCR自定义模板文字识别 磅单识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 OCR助力大宗货运物流交易提效 价值成果 货大大打造煤炭运力交易平台“运销宝”,为煤炭货主和司机提供运力匹配、运输监控、在线结算等服务。在结算环节,应用iOCR通用版,个性化定制磅单识别模板,解决大宗商品交易磅单数据录入问题。司机仅需拍摄、上传磅单图片,即可识别录入车牌号、时间、净重等关键信息。
使用产品 银行卡识别 身份证识别 iOCR自定义模板文字识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 iOCR助力大连市新车电子化缴税改革 价值成果 1、利用百度大脑iOCR自定义模板文字识别技术,创建缴纳车辆购置税相关的资料模板,实现对车辆合格证、购置统一发票及居民居住证等关键内容的精准文字识别的功能。
产品功能 1、审核模型部署包 文本审核: 精准识别文本中的色情低俗、恶意推广、辱骂等内容,具备对拼音、谐音、拆字等变体识别能力。可用于用户昵称、文章、帖子、评论、聊天、直播弹幕等场景。 具体可参考 文本审核接口文档 图像审核: 检测图片中的色情、微商广告、恶心不适等低质内容,也能从美观和清晰等维度对图像进行筛选。可用于用户头像、文章、帖子、评论、聊天、直播画面等场景。
果蔬识别 可识别近千种瓜果蔬菜 红酒识别 识别红酒标签,返回名称、国家、酒庄等信息 货币识别 识别国内外货币,返回货币名称、面值、年份等 图像主体检测 识别图片中主体的位置和标签,支持单/多主体检测 车型识别 检测车辆位置,识别品牌型号、年份、颜色等 车辆检测 检测图片中的车辆,返回每辆车的坐标位置
注意,在输入识别或合成命令后,等待一段时间,确保识别或合成结束,再使用 quit 退出。使用 help 查看帮助。 返回说明 如果配置文件设置了NEED_SAVE_AUDIO,音频会在audio目录下保存,名称为{sn}.pcm,当前请求的sn可在日志文件mrcp_debug.log里查看。
2024-03-14 语音质检服务上新 产品分类: 语音识别 功能描述: 将坐席人员的通话内容转写为文字,并进行AI自动化质检,解决人工抽检成本高昂、覆盖不全等问题,大幅提高语音质量监控效率,助力通话数据分析挖掘。 适用场景: 金融风控、信贷营销、快递物流等多种行业场景,准确率业界领先!
取代人工服务,处理效率提升300% 使用产品: 身份证识别 查看详情 全部案例 行业类型: 全部 教育培训 文化娱乐 交通出行 电子商务 金融 零售 酒店旅游 企业服务 物流货运 生活服务 医疗健康 房产家装 商业地产 智能硬件 制造业 农业 法律政务 安防监控 软件工具 新闻媒体 智能手机 视频直播 游戏 其它 更多 技术方向: 全部 语言理解技术 全功能AI开发平台BML 文字识别 图像审核 图像识别
呼叫中心语音-音频文件转写(8K) 接口描述 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。 步骤 : 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。
音频文件转写API 接口描述 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。 步骤 : 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。