图像识别

    接口说明

    通用物体识别

    该请求用于通用物体及场景识别,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的多个物体及场景标签。

    public void AdvancedGeneralDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用通用物体识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.AdvancedGeneral(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"baike_num", 5}
    	};
    	// 带参数调用通用物体识别
    	result = client.AdvancedGeneral(image, options);
    	Console.WriteLine(result);
    }

    通用物体识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    baike_num string 0 返回百科信息的结果数,默认不返回

    通用物体识别 返回数据参数详情

    字段 是否必选 类型 说明
    log_id uint64 唯一的log id,用于问题定位
    result_num unit32 返回结果数目,及result数组中的元素个数
    result arrry(object) 标签结果数组
    +keyword string 图片中的物体或场景名称
    +score float 置信度,0-1
    +root string 识别结果的上层标签,有部分钱币、动漫、烟酒等tag无上层标签
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述

    通用物体识别 返回示例

    {
      "log_id": 327863200205075661,
      "result_num": 5,
      "result": [{
        "score": 0.967622,
        "root": "公众人物",
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E6%96%B0%E5%9E%A3%E7%BB%93%E8%A1%A3/8035884",
          "image_url": "http://imgsrc.baidu.com/baike/pic/item/91ef76c6a7efce1b27893518a451f3deb58f6546.jpg",
          "description": "新垣结衣(Aragaki Yui),1988年6月11日出生于冲绳县那霸市。日本女演员、歌手、模特。毕业于日出高中。2001年,参加《nicola》模特比赛并获得最优秀奖。2005年,因出演现代剧《涩谷15》而作为演员出道。2006年,参演校园剧《我的老大,我的英雄》;同年,她还出版了个人首本写真集《水漾青春》。2007年,她从日出高校毕业后开始专注于演艺发展,并发表个人首张音乐专辑《天空》;同年,新垣结衣还主演了爱情片《恋空》,而她也凭借该片获得了多个电影新人奖项。2010年,主演爱情片《花水木》。2011年,主演都市剧《全开女孩》。2012年,相继参演现代剧《Legal High》、剧情片《剧场版新参者:麒麟之翼》。2013年,主演都市剧《飞翔情报室》。2014年,她主演了剧情片《黎明的沙耶》。2016年,主演爱情喜剧《逃避虽可耻但有用》,并凭借该剧获得了多个电视剧女主角奖项。2017年,主演爱情片《恋爱回旋》,凭借该片获得第60届蓝丝带奖最佳女主角;同年11月,她还凭借医疗剧《Code Blue 3》获得第94届日剧学院赏最佳女配角。"
        },
        "keyword": "新垣结衣"
      },
      {
        "score": 0.716067,
        "root": "人物-人物特写",
        "keyword": "头发"
      },
      {
        "score": 0.421281,
        "root": "商品-穿戴",
        "keyword": "围巾"
      },
      {
        "score": 0.22347,
        "root": "商品-五金",
        "keyword": "拉链"
      },
      {
        "score": 0.028031,
        "root": "商品-穿戴",
        "keyword": "脖套"
      }]
    }

    菜品识别

    该请求用于菜品识别。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片的菜品名称、卡路里信息、置信度。

    public void DishDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用菜品识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.DishDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"top_num", 3},
    	    {"filter_threshold", "0.7"},
    	    {"baike_num", 5}
    	};
    	// 带参数调用菜品识别
    	result = client.DishDetect(image, options);
    	Console.WriteLine(result);
    }

    菜品识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    top_num string 返回预测得分top结果数,默认为5
    filter_threshold string 默认0.95,可以通过该参数调节识别效果,降低非菜识别率.
    baike_num string 0 返回百科信息的结果数,默认不返回

    菜品识别 返回数据参数详情

    字段 是否必选 类型 说明
    log_id uint64 唯一的log id,用于问题定位
    result_num unit32 返回结果数目,及result数组中的元素个数
    result array() 菜品识别结果数组
    +name string 菜名,示例:鱼香肉丝
    +calorie float 卡路里,每100g的卡路里含量
    +probability float 识别结果中每一行的置信度值,0-1
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述

    菜品识别 返回示例

    {
      "log_id": 7357081719365269362,
      "result_num": 5,
      "result": [
      {
        "calorie": "119",
        "has_calorie": true,
        "name": "酸汤鱼",
        "probability": "0.396031"
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E9%85%B8%E6%B1%A4%E9%B1%BC/1754055",
          "description": "酸汤鱼,是黔桂湘交界地区的一道侗族名菜,与侗族相邻的苗、水、瑶等少数民族也有相似菜肴,但其中以贵州侗族酸汤鱼最为有名,据考证此菜肴最早源于黎平县雷洞镇牙双一带。制作原料主要有鱼肉、酸汤、山仓子等香料。成菜后,略带酸味、幽香沁人、鲜嫩爽口开胃,是贵州“黔系”菜肴的代表作之一。这道菜通常先自制酸汤,之后将活鱼去掉内脏,入酸汤煮制。"
        }
      },
      {
        "calorie": "38",
        "has_calorie": true,
        "name": "原味黑鱼煲",
        "probability": "0.265432",
    
      },
      {
        "calorie": "144",
        "has_calorie": true,
        "name": "椒鱼片",
        "probability": "0.0998993"
      },
      {
        "calorie": "98",
        "has_calorie": true,
        "name": "酸菜鱼",
        "probability": "0.0701917"
      },
      {
        "calorie": "257.65",
        "has_calorie": true,
        "name": "柠檬鱼",
        "probability": "0.0471465"
      }]
    }

    车辆识别

    该请求用于检测一张车辆图片的具体车型。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片的车辆品牌及型号。

    public void CarDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用车辆识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.CarDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"top_num", 3},
    	    {"baike_num", 5}
    	};
    	// 带参数调用车辆识别
    	result = client.CarDetect(image, options);
    	Console.WriteLine(result);
    }

    车辆识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    top_num string 返回预测得分top结果数,默认为5
    baike_num string 0 返回百科信息的结果数,默认不返回

    车辆识别 返回数据参数详情

    字段 是否必选 类型 说明
    log_id uint64 唯一的log id,用于问题定位
    color_result string 颜色
    result car-result() 车型识别结果数组
    +name string 车型名称,示例:宝马x6
    +score double 置信度,示例:0.5321
    +year string 年份
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述
    location_result string 车在图片中的位置信息

    车辆识别 返回示例

    {
      "log_id": 4086212218842203806,
      "location_result": {
        "width": 447,
        "top": 226,
        "height": 209,
        "left": 188
      },
      "result": [{
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E5%B8%83%E5%8A%A0%E8%BF%AAChiron/20419512",
          "description": "布加迪Chiron是法国跑车品牌布加迪出品的豪华超跑车。配置四涡轮增压发动机,420 公里每小时,有23种颜色的选择,售价高达260万美元。"
        },
        "score": 0.98793351650238,
        "name": "布加迪Chiron",
        "year": "无年份信息"
      },
      {
        "score": 0.0021970034576952,
        "name": "奥迪RS5",
        "year": "2011-2017"
      },
      {
        "score": 0.0021096928976476,
        "name": "奥迪RS4",
        "year": "无年份信息"
      },
      {
        "score": 0.0015581247862428,
        "name": "奥迪RS7",
        "year": "2014-2016"
      },
      {
        "score": 0.00082337751518935,
        "name": "布加迪威航",
        "year": "2004-2015"
      }],
      "color_result": "颜色无法识别"
    }

    logo商标识别

    该请求用于检测和识别图片中的品牌LOGO信息。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中LOGO的名称、位置和置信度。当效果欠佳时,可以建立子库(在控制台创建应用并申请建库)并通过调用logo入口接口完成自定义logo入库,提高识别效果。

    public void LogoSearchDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用logo商标识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.LogoSearch(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"custom_lib", "true"}
    	};
    	// 带参数调用logo商标识别
    	result = client.LogoSearch(image, options);
    	Console.WriteLine(result);
    }

    logo商标识别 请求参数详情

    参数名称 是否必选 类型 可选值范围 默认值 说明
    image byte[] 二进制图像数据
    custom_lib string true - 返回自定义库
    false - 返回自定义库+默认库的识别结果
    false 是否只使用自定义logo库的结果,默认false:返回自定义库+默认库的识别结果

    logo商标识别 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 请求标识码,随机数,唯一 507499361
    result_num number 返回结果数目,即:result数组中元素个数 2
    result array 返回结果数组,每一项为一个识别出的logo -
    +location object 位置信息(左起像素位置、上起像素位置、像素宽、像素高) {"left": 100,"top":100,"width":10,"height":10}
    ++left number 左起像素位置 100
    ++top number 上起像素位置 100
    ++width number 像素宽 100
    ++height number 像素高 100
    +name string 识别的品牌名称 京东
    +probability number 分类结果置信度(0--1.0) 0.8
    +type number type=0为1千种高优商标识别结果;type=1为2万类logo库的结果;其它type为自定义logo库结果 1 (2万类的结果)

    logo商标识别 返回示例

    {
      "log_id": 843411868,
      "result_num": 1,
      "result": [
        {
          "type": 0,
          "name": "科颜氏",
          "probability": 0.99998807907104,
          "location": {
            "width": 296,
            "top": 20,
            "height": 128,
            "left": 23
          }
        }
      ]
    }

    logo商标识别—添加

    使用入库接口请先在控制台创建应用并申请建库,建库成功后方可正常使用。

    public void LogoAddDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	var brief = "{\"name\": \"宝马\",\"code\":\"666\"}";
    	
    	// 调用logo商标识别—添加,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.LogoAdd(image, brief);
    	Console.WriteLine(result);
    }

    logo商标识别—添加 请求参数详情

    参数名称 是否必选 类型 说明
    image byte[] 二进制图像数据
    brief string brief,检索时带回。此处要传对应的name与code字段,name长度小于100B,code长度小于150B

    logo商标识别—添加 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 请求标识码,随机数,唯一 507499361
    cont_sign string 输入图片签名,可用于删除 -

    logo商标识别—添加 返回示例

    {
      "log_id": 972934653,
      "cont_sign": "217113248,419422301"
    }

    logo商标识别—删除

    使用删除接口请先在控制台创建应用并申请建库,建库成功后先调用入库接口完成logo图片入库,删除接口用户在已入库的logo图片中删除图片。

    public void LogoDeleteByImageDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用删除logo商标,传入参数为图片,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.LogoDeleteByImage(image);
    	Console.WriteLine(result);
    }
    public void LogoDeleteBySignDemo() {
    	var contSign = "8cnn32frvrr2cd901";
    	
    	// 调用删除logo商标,传入参数为图片签名,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.LogoDeleteBySign(contSign);
    	Console.WriteLine(result);
    }

    logo商标识别—删除 请求参数详情

    参数名称 是否必选 类型 说明
    image byte[] 二进制图像数据
    cont_sign string 图片签名(和image二选一,image优先级更高)

    logo商标识别—删除 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 请求标识码,随机数,唯一 507499361

    logo商标识别—删除 返回示例

    {
      "log_id": 50488417
    }

    动物识别

    该请求用于识别一张图片。即对于输入的一张图片(可正常解码,且长宽比适宜),输出动物识别结果

    public void AnimalDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用动物识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.AnimalDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"top_num", 3},
    	    {"baike_num", 5}
    	};
    	// 带参数调用动物识别
    	result = client.AnimalDetect(image, options);
    	Console.WriteLine(result);
    }

    动物识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    top_num string 6 返回预测得分top结果数,默认为6
    baike_num string 0 返回百科信息的结果数,默认不返回

    动物识别 返回数据参数详情

    参数 类型 是否必须 说明
    log_id uint64 唯一的log id,用于问题定位
    result arrry(object) 识别结果数组
    +name string 动物名称,示例:蒙古马
    +score uint32 置信度,示例:0.5321
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述

    动物识别 返回示例

    {
      "log_id": 7392482912853822863,
      "result": [{
        "score": "0.993811",
        "name": "叉角羚",
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E5%8F%89%E8%A7%92%E7%BE%9A/801703",
          "description": "叉角羚(学名:Antilocapra americana):在角的中部角鞘有向前伸的分枝,故名。体型中等,体长1-1.5米,尾长7.5-10厘米,肩高81-104厘米,成体重36-60千克,雌体比雄体小;背面为红褐色,颈部有黑色鬃毛,腹部和臀部为白色,颊面部和颈部两侧有黑色块斑;毛被下面为绒毛,上覆以粗糙、质脆的长毛,由于某些皮肤肌的作用,能使其毛被呈不同角度,以利于保暖或散热。植食。叉角羚奔跑速度非常快,最高时速达100千米。一次跳跃可达3.5-6米。善游泳。夏季组成小群活动,冬季则集结成上百只的大群。为寻找食物和水源,一年中常进行几次迁移。性机警,视觉敏锐,能看到数千米外的物体。遇险时,臀部的白色毛能立起,向同伴告警。分布于北美洲。"
        }
      },
      {
        "score": "0.000289439",
        "name": "印度羚"
      },
      {
        "score": "0.000186248",
        "name": "藏羚羊"
      },
      {
        "score": "0.000147176",
        "name": "跳羚"
      },
      {
        "score": "0.000134434",
        "name": "驯鹿"
      },
      {
        "score": "9.86555e-05",
        "name": "高鼻羚羊"
      }]
    }

    植物识别

    该请求用于识别一张图片。即对于输入的一张图片(可正常解码,且长宽比适宜),输出植物识别结果。

    public void PlantDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用植物识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.PlantDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"baike_num", 5}
    	};
    	// 带参数调用植物识别
    	result = client.PlantDetect(image, options);
    	Console.WriteLine(result);
    }

    植物识别 请求参数详情

    参数名称 是否必选 类型 默认值 说明
    image byte[] 二进制图像数据
    baike_num string 0 返回百科信息的结果数,默认不返回

    植物识别 返回数据参数详情

    参数 类型 是否必须 说明
    log_id uint64 唯一的log id,用于问题定位
    result arrry(object) 植物识别结果数组
    +name string 植物名称,示例:吉娃莲
    +score uint32 置信度,示例:0.5321
    +baike_info object 对应识别结果的百科词条名称
    ++baike_url string 对应识别结果百度百科页面链接
    ++image_url string 对应识别结果百科图片链接
    ++description string 对应识别结果百科内容描述

    植物识别 返回示例

    {
      "log_id": 1705495792822072357,
      "result": [{
        "score": 0.99979120492935,
        "name": "莲",
        "baike_info": {
          "baike_url": "http://baike.baidu.com/item/%E8%8E%B2/2717141",
          "description": "莲(Nelumbo nucifera),又称荷、荷花、莲花、芙蕖、鞭蓉、水芙蓉、水芝、水芸、水旦、水华等,溪客、玉环是其雅称,未开的花蕾称菡萏,已开的花朵称鞭蕖,莲科,属多年生水生宿根草本植物,其地下茎称藕,能食用,叶入药,莲子为上乘补品,花可供观赏。是我国十大名花之一。是印度的国花。莲,双子叶植物,睡莲科。多年生挺水草本植物。根状茎横走,粗而肥厚,节间膨大,内有纵横通气孔道,节部缢缩。叶基生,挺出水面,盾形,直径30-90cm,波状边缘,上面深绿色,下面浅绿色。叶柄有小刺,长1-2m,挺出水面。花单生,直径10-25cm,椭圆花瓣多数,白色或粉红色;花柄长1-2m。花托在果期膨大,直径5-10cm,海绵质。坚果椭圆形和卵圆形,长1.5-2.0cm,灰褐色。种子卵圆形,长1.2-1.7cm,种皮红棕色。生于池塘、浅湖泊及稻田中。中国南北各省有自生或栽培,经济价值高。人们习惯上称种子为“莲子”、地下茎为“藕”、花托为“莲蓬”、叶为“荷叶”。"
        }
      },
      {
        "score": 0.00015144718054216,
        "name": "红睡莲"
      },
      {
        "score": 1.2172759852547e-05,
        "name": "白睡莲"
      },
      {
        "score": 6.305016540864e-06,
        "name": "延药睡莲"
      },
      {
        "score": 3.6133328649157e-06,
        "name": "华夏慈姑"
      }]
    }

    图像主体检测

    用户向服务请求检测图像中的主体位置。

    public void ObjectDetectDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用图像主体检测,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.ObjectDetect(image);
    	Console.WriteLine(result);
    	// 如果有可选参数
    	var options = new Dictionary<string, object>{
    	    {"with_face", 0}
    	};
    	// 带参数调用图像主体检测
    	result = client.ObjectDetect(image, options);
    	Console.WriteLine(result);
    }

    图像主体检测 请求参数详情

    参数名称 是否必选 类型 可选值范围 默认值 说明
    image byte[] 二进制图像数据
    with_face string 0 - 不带人脸区域
    1 - 带人脸区域
    1 如果检测主体是人,主体区域是否带上人脸部分,0-不带人脸区域,其他-带人脸区域,裁剪类需求推荐带人脸,检索/识别类需求推荐不带人脸。默认取1,带人脸。

    图像主体检测 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 唯一的log id,用于问题定位 507499361
    result object 裁剪结果 -
    +left number 表示定位位置的长方形左上顶点的水平坐标 50
    +top number 表示定位位置的长方形左上顶点的垂直坐标 60
    +width number 表示定位位置的长方形的宽度 200
    +height number 表示定位位置的长方形的高度 200

    图像主体检测 返回示例

    {
      "log_id": 895582300,
      "result": {
        "width": 486,
        "top": 76,
        "left": 134,
        "height": 394
      }
    }

    地标识别

    该请求用于识别地标,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的地标识别结果。

    public void LandmarkDemo() {
    	var image = File.ReadAllBytes("图片文件路径");
    	// 调用地标识别,可能会抛出网络等异常,请使用try/catch捕获
    	var result = client.Landmark(image);
    	Console.WriteLine(result);
    }

    地标识别 请求参数详情

    参数名称 是否必选 类型 说明
    image byte[] 二进制图像数据

    地标识别 返回数据参数详情

    参数 类型 是否必须 说明 示例
    log_id number 唯一的log id,用于问题定位 507499361
    result object 裁剪结果 -
    +landmark string 地标名称,无法识别则返回空字符串 狮身人面像

    地标识别 返回示例

    {
      "log_id": 3450013152046070669,
      "result":
      {
        "landmark": "狮身人面像"
      }
    }
    上一篇
    快速入门
    下一篇
    FAQ