简介
所有文档

          图像识别

          简介

          Hi,您好,欢迎使用百度图像识别API服务。

          本文档主要针对API开发者,描述百度图像识别接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

          • 在百度智能云控制台内提交工单;进入AI社区交流 ;提交合作咨询
          • 具有免费调用额度的接口,超过免费额度后会返回错误码 17(每天请求量超限额:Open api daily request limit reached ),或者错误码 19(请求总量超限额:Open api total request limit reached)
          • 未上线计费的接口,可通过QQ群(312156782)联系群管、或提交工单手动提额;已上线计费的接口,请直接在控制台开通计费、或者购买次数包、QPS叠加包,调用量不受限制,按调用次数计费。

          接口能力

          图像识别接口一览表

          接口名称 接口能力简要描述
          图像单主体检测 识别图像中的主体具体坐标位置。
          图像多主体检测(邀测) 检测出图片中多个主体,并给出位置、标签和置信得分。
          通用物体和场景识别高级版 识别图片中的场景及物体标签,支持10w+标签类型。
          菜品识别 检测用户上传的菜品图片,返回具体的菜名、卡路里、置信度信息。
          自定义菜品识别 入库自定义的单菜品图,实现上传多菜品图的精准识别,返回具体的菜名、位置、置信度信息
          logo商标识别 识别图片中包含的商品LOGO信息,返回LOGO品牌名称、在图片中的位置、置信度。
          动物识别 检测用户上传的动物图片,返回动物名称、置信度信息。
          植物识别 检测用户上传的植物图片,返回植物名称、置信度信息。
          果蔬食材识别 检测用户上传的果蔬类图片,返回果蔬名称、置信度信息。
          地标识别 检测用户上传的地标图片,返回地标名称。
          红酒识别 识别图像中的红酒标签,返回红酒名称、国家、产区、酒庄、类型、糖分、葡萄品种、酒品描述等信息。
          货币识别 识别图像中的货币类型,返回货币名称、代码、面值、年份信息,可识别百余种国内外常见货币。

          请求格式

          POST方式调用

          注意:Content-Type为application/x-www-form-urlencoded,然后通过urlencode格式化请求体。

          返回格式

          JSON格式

          请求限制

          请求图片需经过base64编码:图片的base64编码指将一副图片数据编码成一串字符串,使用该字符串代替图像地址。您可以首先得到图片的二进制,然后用Base64格式编码即可。

          注意:图片的base64编码是不包含图片头的,如(data:image/jpg;base64,)

          请求格式支持:PNG、JPG、JPEG、BMP**

          接口名称 图片编码后大小限额
          通用物体和场景识别 base64编码后大小不超过4M,最短边至少30px,最长边最大4096px,长宽比3:1以内
          菜品识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
          自定义菜品识别 base64编码后大小不超过4M,最短边至少300px,最长边最大3000px,长宽比3:1以内
          logo商标识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
          图像单主体检测 base64编码后大小不超过4M,最短边至少20px,最长边最大4096px,长宽比3:1以内
          图像多主体检测(邀测) base64编码后大小不超过4M,最短边至少64px,最长边最大4096px,长宽比3:1以内
          动物识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
          植物识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
          果蔬食材识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
          地标识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
          红酒识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
          货币识别 base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,长宽比3:1以内
          上一篇
          QuickStart
          下一篇
          调用方式