智慧图问 插件功能 :图片解析插件,主要功能为图片理解与识别,并对图片内容进行总结概述,输出用户可理解的自然语言文本描述(句子或段落)。 识别能力包含文字OCR解析、人物识别、植物识别、商品识别、车辆识别等等。
但是音频内容不是语音识别要求的 自然人发音 ,所以识别效果会受影响。
接口能力 接口名称 接口能力简要描述 语音识别 采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景。 短语音识别 将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。
数字水印:支持向视频和图片中嵌入肉眼不可见的文字或图片,且对视频质量影响小,对常见攻击具有一定抵抗能力。在发生版权纠纷时,可通过数字水印提取服务提取水印内容,证明版权归属。
类别 服务名 单次成功调用所抵扣的点数 通用场景文字识别 通用文字识别(标准版) 5 通用文字识别(标准含位置版) 5 通用文字识别(高精度版) 10 通用文字识别(高精度含位置版) 10 网络图片文字识别 5 网络图片文字识别(含位置版) 5 办公文档识别 25 表格文字识别V2 25 智能结构化 25 数字识别 5 手写文字识别 5 二维码识别 5 印章识别 5 卡证文字识别 身份证识别 5 身份证混贴识别
通过编写代码调用语音技术服务 API 如果您是开发工程师,熟悉代码编写,您可以通过编写代码的方式调用文字识别服务。具体请参见 如何用代码调用 。 通过软件开发工具包(HTTP-SDK)调用语音技术服务 如果您是开发工程师,熟悉代码编写,您可以通过已编写好的软件开发工具包(HTTP-SDK)来调用文字识别服务 API 。
功能介绍 图片解析插件 ,主要功能为图片理解与识别,并对图片内容进行总结概述,输出用户可理解的自然语言文本描述(句子或段落)。识别能力包含文字OCR解析、人物识别、植物识别、商品识别、车辆识别等。
有疑问请通过QQ群(868826008)或工单联系技术支持团队 336004 输入文件大小不合法 图片超出大小限制,图片限4M以内,请根据接口文档检查入参格式,有疑问请通过QQ群(868826008)或工单联系技术支持团队 336005 图片解码失败 图片编码错误(非jpg,bmp,png等常见图片格式),请检查并修改图片格式 336006 缺失必要参数 image字段缺失(未上传图片) 336100
说明: 智能图片处理仅支持图片处理 V2.0 版本,V1.0 版本暂不支持。 规则与限制 智能图片处理支持的原图格式:PNG、JPG、JPEG、BMP。 支持的目标格式:PNG、JPG、JPEG、BMP。 需要处理的图片 base64 编码后大小不超过 4M,最短边至少 64px,最长边最大 4096px,长宽比 3:1 以内。特殊说明的除外。
说明: 智能图片处理仅支持图片处理 V2.0 版本,V1.0 版本暂不支持。 规则与限制 智能图片处理支持的原图格式:PNG、JPG、JPEG、BMP。 支持的目标格式:PNG、JPG、JPEG、BMP。 需要处理的图片 base64 编码后大小不超过 4M,最短边至少 64px,最长边最大 4096px,长宽比 3:1 以内。特殊说明的除外。