接口说明

通用物体识别

该请求用于通用物体及场景识别,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的多个物体及场景标签。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用通用物体识别 """
client.advancedGeneral(image);

""" 如果有可选参数 """
options = {}
options["baike_num"] = 5

""" 带参数调用通用物体识别 """
client.advancedGeneral(image, options)

通用物体识别 请求参数详情

参数名称 是否必选 类型 默认值 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
baike_num string 0 返回百科信息的结果数,默认不返回

通用物体识别 返回数据参数详情

字段 是否必选 类型 说明
log_id uint64 唯一的log id,用于问题定位
result_num unit32 返回结果数目,及result数组中的元素个数
result arrry(object) 标签结果数组
+keyword string 图片中的物体或场景名称
+score float 置信度,0-1
+root string 识别结果的上层标签,有部分钱币、动漫、烟酒等tag无上层标签
+baike_info object 对应识别结果的百科词条名称
++baike_url string 对应识别结果百度百科页面链接
++image_url string 对应识别结果百科图片链接
++description string 对应识别结果百科内容描述

通用物体识别 返回示例

{
  "log_id": 327863200205075661,
  "result_num": 5,
  "result": [{
    "score": 0.967622,
    "root": "公众人物",
    "baike_info": {
      "baike_url": "http://baike.baidu.com/item/%E6%96%B0%E5%9E%A3%E7%BB%93%E8%A1%A3/8035884",
      "image_url": "http://imgsrc.baidu.com/baike/pic/item/91ef76c6a7efce1b27893518a451f3deb58f6546.jpg",
      "description": "新垣结衣(Aragaki Yui),1988年6月11日出生于冲绳县那霸市。日本女演员、歌手、模特。毕业于日出高中。2001年,参加《nicola》模特比赛并获得最优秀奖。2005年,因出演现代剧《涩谷15》而作为演员出道。2006年,参演校园剧《我的老大,我的英雄》;同年,她还出版了个人首本写真集《水漾青春》。2007年,她从日出高校毕业后开始专注于演艺发展,并发表个人首张音乐专辑《天空》;同年,新垣结衣还主演了爱情片《恋空》,而她也凭借该片获得了多个电影新人奖项。2010年,主演爱情片《花水木》。2011年,主演都市剧《全开女孩》。2012年,相继参演现代剧《Legal High》、剧情片《剧场版新参者:麒麟之翼》。2013年,主演都市剧《飞翔情报室》。2014年,她主演了剧情片《黎明的沙耶》。2016年,主演爱情喜剧《逃避虽可耻但有用》,并凭借该剧获得了多个电视剧女主角奖项。2017年,主演爱情片《恋爱回旋》,凭借该片获得第60届蓝丝带奖最佳女主角;同年11月,她还凭借医疗剧《Code Blue 3》获得第94届日剧学院赏最佳女配角。"
    },
    "keyword": "新垣结衣"
  },
  {
    "score": 0.716067,
    "root": "人物-人物特写",
    "keyword": "头发"
  },
  {
    "score": 0.421281,
    "root": "商品-穿戴",
    "keyword": "围巾"
  },
  {
    "score": 0.22347,
    "root": "商品-五金",
    "keyword": "拉链"
  },
  {
    "score": 0.028031,
    "root": "商品-穿戴",
    "keyword": "脖套"
  }]
}

菜品识别

该请求用于菜品识别。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片的菜品名称、卡路里信息、置信度。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用菜品识别 """
client.dishDetect(image);

""" 如果有可选参数 """
options = {}
options["top_num"] = 3
options["filter_threshold"] = "0.7"
options["baike_num"] = 5

""" 带参数调用菜品识别 """
client.dishDetect(image, options)

菜品识别 请求参数详情

参数名称 是否必选 类型 默认值 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
top_num string 返回预测得分top结果数,默认为5
filter_threshold string 默认0.95,可以通过该参数调节识别效果,降低非菜识别率.
baike_num string 0 返回百科信息的结果数,默认不返回

菜品识别 返回数据参数详情

字段 是否必选 类型 说明
log_id uint64 唯一的log id,用于问题定位
result_num unit32 返回结果数目,及result数组中的元素个数
result array() 菜品识别结果数组
+name string 菜名,示例:鱼香肉丝
+calorie float 卡路里,每100g的卡路里含量
+probability float 识别结果中每一行的置信度值,0-1
+baike_info object 对应识别结果的百科词条名称
++baike_url string 对应识别结果百度百科页面链接
++image_url string 对应识别结果百科图片链接
++description string 对应识别结果百科内容描述

菜品识别 返回示例

{
  "log_id": 7357081719365269362,
  "result_num": 5,
  "result": [
  {
    "calorie": "119",
    "has_calorie": true,
    "name": "酸汤鱼",
    "probability": "0.396031"
    "baike_info": {
      "baike_url": "http://baike.baidu.com/item/%E9%85%B8%E6%B1%A4%E9%B1%BC/1754055",
      "description": "酸汤鱼,是黔桂湘交界地区的一道侗族名菜,与侗族相邻的苗、水、瑶等少数民族也有相似菜肴,但其中以贵州侗族酸汤鱼最为有名,据考证此菜肴最早源于黎平县雷洞镇牙双一带。制作原料主要有鱼肉、酸汤、山仓子等香料。成菜后,略带酸味、幽香沁人、鲜嫩爽口开胃,是贵州“黔系”菜肴的代表作之一。这道菜通常先自制酸汤,之后将活鱼去掉内脏,入酸汤煮制。"
    }
  },
  {
    "calorie": "38",
    "has_calorie": true,
    "name": "原味黑鱼煲",
    "probability": "0.265432",

  },
  {
    "calorie": "144",
    "has_calorie": true,
    "name": "椒鱼片",
    "probability": "0.0998993"
  },
  {
    "calorie": "98",
    "has_calorie": true,
    "name": "酸菜鱼",
    "probability": "0.0701917"
  },
  {
    "calorie": "257.65",
    "has_calorie": true,
    "name": "柠檬鱼",
    "probability": "0.0471465"
  }]
}

车辆识别

该请求用于检测一张车辆图片的具体车型。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片的车辆品牌及型号。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用车辆识别 """
client.carDetect(image);

""" 如果有可选参数 """
options = {}
options["top_num"] = 3
options["baike_num"] = 5

""" 带参数调用车辆识别 """
client.carDetect(image, options)

车辆识别 请求参数详情

参数名称 是否必选 类型 默认值 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
top_num string 返回预测得分top结果数,默认为5
baike_num string 0 返回百科信息的结果数,默认不返回

车辆识别 返回数据参数详情

字段 是否必选 类型 说明
log_id uint64 唯一的log id,用于问题定位
color_result string 颜色
result car-result() 车型识别结果数组
+name string 车型名称,示例:宝马x6
+score double 置信度,示例:0.5321
+year string 年份
+baike_info object 对应识别结果的百科词条名称
++baike_url string 对应识别结果百度百科页面链接
++image_url string 对应识别结果百科图片链接
++description string 对应识别结果百科内容描述
location_result string 车在图片中的位置信息

车辆识别 返回示例

{
  "log_id": 4086212218842203806,
  "location_result": {
    "width": 447,
    "top": 226,
    "height": 209,
    "left": 188
  },
  "result": [{
    "baike_info": {
      "baike_url": "http://baike.baidu.com/item/%E5%B8%83%E5%8A%A0%E8%BF%AAChiron/20419512",
      "description": "布加迪Chiron是法国跑车品牌布加迪出品的豪华超跑车。配置四涡轮增压发动机,420 公里每小时,有23种颜色的选择,售价高达260万美元。"
    },
    "score": 0.98793351650238,
    "name": "布加迪Chiron",
    "year": "无年份信息"
  },
  {
    "score": 0.0021970034576952,
    "name": "奥迪RS5",
    "year": "2011-2017"
  },
  {
    "score": 0.0021096928976476,
    "name": "奥迪RS4",
    "year": "无年份信息"
  },
  {
    "score": 0.0015581247862428,
    "name": "奥迪RS7",
    "year": "2014-2016"
  },
  {
    "score": 0.00082337751518935,
    "name": "布加迪威航",
    "year": "2004-2015"
  }],
  "color_result": "颜色无法识别"
}

logo商标识别

该请求用于检测和识别图片中的品牌LOGO信息。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中LOGO的名称、位置和置信度。当效果欠佳时,可以建立子库(在控制台创建应用并申请建库)并通过调用logo入口接口完成自定义logo入库,提高识别效果。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用logo商标识别 """
client.logoSearch(image);

""" 如果有可选参数 """
options = {}
options["custom_lib"] = "true"

""" 带参数调用logo商标识别 """
client.logoSearch(image, options)

logo商标识别 请求参数详情

参数名称 是否必选 类型 可选值范围 默认值 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
custom_lib string true - 返回自定义库
false - 返回自定义库+默认库的识别结果
false 是否只使用自定义logo库的结果,默认false:返回自定义库+默认库的识别结果

logo商标识别 返回数据参数详情

参数 类型 是否必须 说明 示例
log_id number 请求标识码,随机数,唯一 507499361
result_num number 返回结果数目,即:result数组中元素个数 2
result array 返回结果数组,每一项为一个识别出的logo -
+location object 位置信息(左起像素位置、上起像素位置、像素宽、像素高) {"left": 100,"top":100,"width":10,"height":10}
++left number 左起像素位置 100
++top number 上起像素位置 100
++width number 像素宽 100
++height number 像素高 100
+name string 识别的品牌名称 京东
+probability number 分类结果置信度(0--1.0) 0.8
+type number type=0为1千种高优商标识别结果;type=1为2万类logo库的结果;其它type为自定义logo库结果 1 (2万类的结果)

logo商标识别 返回示例

{
  "log_id": 843411868,
  "result_num": 1,
  "result": [
    {
      "type": 0,
      "name": "科颜氏",
      "probability": 0.99998807907104,
      "location": {
        "width": 296,
        "top": 20,
        "height": 128,
        "left": 23
      }
    }
  ]
}

logo商标识别—添加

使用入库接口请先在控制台创建应用并申请建库,建库成功后方可正常使用。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')
brief = "{\"name\": \"宝马\",\"code\":\"666\"}"

""" 调用logo商标识别—添加 """
client.logoAdd(image, brief);

logo商标识别—添加 请求参数详情

参数名称 是否必选 类型 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
brief string brief,检索时带回。此处要传对应的name与code字段,name长度小于100B,code长度小于150B

logo商标识别—添加 返回数据参数详情

参数 类型 是否必须 说明 示例
log_id number 请求标识码,随机数,唯一 507499361
cont_sign string 输入图片签名,可用于删除 -

logo商标识别—添加 返回示例

{
  "log_id": 972934653,
  "cont_sign": "217113248,419422301"
}

logo商标识别—删除

使用删除接口请先在控制台创建应用并申请建库,建库成功后先调用入库接口完成logo图片入库,删除接口用户在已入库的logo图片中删除图片。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用删除logo商标,传入参数为图片 """
client.logoDeleteByImage(image);

contSign = "8cnn32frvrr2cd901"

""" 调用删除logo商标,传入参数为图片签名 """
client.logoDeleteBySign(contSign);

logo商标识别—删除 请求参数详情

参数名称 是否必选 类型 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
cont_sign string 图片签名(和image二选一,image优先级更高)

logo商标识别—删除 返回数据参数详情

参数 类型 是否必须 说明 示例
log_id number 请求标识码,随机数,唯一 507499361

logo商标识别—删除 返回示例

{
  "log_id": 50488417
}

动物识别

该请求用于识别一张图片。即对于输入的一张图片(可正常解码,且长宽比适宜),输出动物识别结果

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用动物识别 """
client.animalDetect(image);

""" 如果有可选参数 """
options = {}
options["top_num"] = 3
options["baike_num"] = 5

""" 带参数调用动物识别 """
client.animalDetect(image, options)

动物识别 请求参数详情

参数名称 是否必选 类型 默认值 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
top_num string 6 返回预测得分top结果数,默认为6
baike_num string 0 返回百科信息的结果数,默认不返回

动物识别 返回数据参数详情

参数 类型 是否必须 说明
log_id uint64 唯一的log id,用于问题定位
result arrry(object) 识别结果数组
+name string 动物名称,示例:蒙古马
+score uint32 置信度,示例:0.5321
+baike_info object 对应识别结果的百科词条名称
++baike_url string 对应识别结果百度百科页面链接
++image_url string 对应识别结果百科图片链接
++description string 对应识别结果百科内容描述

动物识别 返回示例

{
  "log_id": 7392482912853822863,
  "result": [{
    "score": "0.993811",
    "name": "叉角羚",
    "baike_info": {
      "baike_url": "http://baike.baidu.com/item/%E5%8F%89%E8%A7%92%E7%BE%9A/801703",
      "description": "叉角羚(学名:Antilocapra americana):在角的中部角鞘有向前伸的分枝,故名。体型中等,体长1-1.5米,尾长7.5-10厘米,肩高81-104厘米,成体重36-60千克,雌体比雄体小;背面为红褐色,颈部有黑色鬃毛,腹部和臀部为白色,颊面部和颈部两侧有黑色块斑;毛被下面为绒毛,上覆以粗糙、质脆的长毛,由于某些皮肤肌的作用,能使其毛被呈不同角度,以利于保暖或散热。植食。叉角羚奔跑速度非常快,最高时速达100千米。一次跳跃可达3.5-6米。善游泳。夏季组成小群活动,冬季则集结成上百只的大群。为寻找食物和水源,一年中常进行几次迁移。性机警,视觉敏锐,能看到数千米外的物体。遇险时,臀部的白色毛能立起,向同伴告警。分布于北美洲。"
    }
  },
  {
    "score": "0.000289439",
    "name": "印度羚"
  },
  {
    "score": "0.000186248",
    "name": "藏羚羊"
  },
  {
    "score": "0.000147176",
    "name": "跳羚"
  },
  {
    "score": "0.000134434",
    "name": "驯鹿"
  },
  {
    "score": "9.86555e-05",
    "name": "高鼻羚羊"
  }]
}

植物识别

该请求用于识别一张图片。即对于输入的一张图片(可正常解码,且长宽比适宜),输出植物识别结果。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用植物识别 """
client.plantDetect(image);

""" 如果有可选参数 """
options = {}
options["baike_num"] = 5

""" 带参数调用植物识别 """
client.plantDetect(image, options)

植物识别 请求参数详情

参数名称 是否必选 类型 默认值 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
baike_num string 0 返回百科信息的结果数,默认不返回

植物识别 返回数据参数详情

参数 类型 是否必须 说明
log_id uint64 唯一的log id,用于问题定位
result arrry(object) 植物识别结果数组
+name string 植物名称,示例:吉娃莲
+score uint32 置信度,示例:0.5321
+baike_info object 对应识别结果的百科词条名称
++baike_url string 对应识别结果百度百科页面链接
++image_url string 对应识别结果百科图片链接
++description string 对应识别结果百科内容描述

植物识别 返回示例

{
  "log_id": 1705495792822072357,
  "result": [{
    "score": 0.99979120492935,
    "name": "莲",
    "baike_info": {
      "baike_url": "http://baike.baidu.com/item/%E8%8E%B2/2717141",
      "description": "莲(Nelumbo nucifera),又称荷、荷花、莲花、芙蕖、鞭蓉、水芙蓉、水芝、水芸、水旦、水华等,溪客、玉环是其雅称,未开的花蕾称菡萏,已开的花朵称鞭蕖,莲科,属多年生水生宿根草本植物,其地下茎称藕,能食用,叶入药,莲子为上乘补品,花可供观赏。是我国十大名花之一。是印度的国花。莲,双子叶植物,睡莲科。多年生挺水草本植物。根状茎横走,粗而肥厚,节间膨大,内有纵横通气孔道,节部缢缩。叶基生,挺出水面,盾形,直径30-90cm,波状边缘,上面深绿色,下面浅绿色。叶柄有小刺,长1-2m,挺出水面。花单生,直径10-25cm,椭圆花瓣多数,白色或粉红色;花柄长1-2m。花托在果期膨大,直径5-10cm,海绵质。坚果椭圆形和卵圆形,长1.5-2.0cm,灰褐色。种子卵圆形,长1.2-1.7cm,种皮红棕色。生于池塘、浅湖泊及稻田中。中国南北各省有自生或栽培,经济价值高。人们习惯上称种子为“莲子”、地下茎为“藕”、花托为“莲蓬”、叶为“荷叶”。"
    }
  },
  {
    "score": 0.00015144718054216,
    "name": "红睡莲"
  },
  {
    "score": 1.2172759852547e-05,
    "name": "白睡莲"
  },
  {
    "score": 6.305016540864e-06,
    "name": "延药睡莲"
  },
  {
    "score": 3.6133328649157e-06,
    "name": "华夏慈姑"
  }]
}

图像主体检测

用户向服务请求检测图像中的主体位置。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用图像主体检测 """
client.objectDetect(image);

""" 如果有可选参数 """
options = {}
options["with_face"] = 0

""" 带参数调用图像主体检测 """
client.objectDetect(image, options)

图像主体检测 请求参数详情

参数名称 是否必选 类型 可选值范围 默认值 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
with_face string 0 - 不带人脸区域
1 - 带人脸区域
1 如果检测主体是人,主体区域是否带上人脸部分,0-不带人脸区域,其他-带人脸区域,裁剪类需求推荐带人脸,检索/识别类需求推荐不带人脸。默认取1,带人脸。

图像主体检测 返回数据参数详情

参数 类型 是否必须 说明 示例
log_id number 唯一的log id,用于问题定位 507499361
result object 裁剪结果 -
+left number 表示定位位置的长方形左上顶点的水平坐标 50
+top number 表示定位位置的长方形左上顶点的垂直坐标 60
+width number 表示定位位置的长方形的宽度 200
+height number 表示定位位置的长方形的高度 200

图像主体检测 返回示例

{
  "log_id": 895582300,
  "result": {
    "width": 486,
    "top": 76,
    "left": 134,
    "height": 394
  }
}

地标识别

该请求用于识别地标,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的地标识别结果。

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example.jpg')

""" 调用地标识别 """
client.landmark(image);

地标识别 请求参数详情

参数名称 是否必选 类型 说明
image string 图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式

地标识别 返回数据参数详情

参数 类型 是否必须 说明 示例
log_id number 唯一的log id,用于问题定位 507499361
result object 裁剪结果 -
+landmark string 地标名称,无法识别则返回空字符串 狮身人面像

地标识别 返回示例

{
  "log_id": 3450013152046070669,
  "result":
  {
    "landmark": "狮身人面像"
  }
}