支持MCP接入的图像识别工具清单
更新时间:2026-03-05
支持MCP接入的图像识别工具清单
| 工具名称 | 工具描述 | 功能说明 |
|---|---|---|
| image_general_scene | 通用物体和场景识别 | 该请求用于通用物体及场景识别,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的多个物体及场景标签。 |
| image_vehicle_detect | 车辆检测 | 传入单帧图像,检测图片中所有机动车辆,返回每辆车的类型和坐标位置,可识别小汽车、卡车、巴士、摩托车、三轮车5类车辆,并对每类车辆分别计数,同时可定位小汽车、卡车、巴士的车牌位置,支持指定矩形区域的车辆检测与数量统计。 当前主要适用于普通监控场景,如道路、停车场等,无人机高空拍摄的图片,因车辆目标较小,识别效果可能欠佳,后续会扩展支持超高空拍摄场景,如有该场景的需求,请通过QQ群或提交工单,详细沟通测试情况。 |
| image_fruit_veg | 果蔬识别 | 识别图像中的果蔬类别。 |
| image_car_type | 车型识别 | 识别图片中车辆的具体车型,可识别常见的3000+款车型(小汽车为主),输出车辆的品牌型号、颜色、年份、位置信息;支持返回对应识别结果的百度百科词条信息,包含词条名称、百科页面链接、百科图片链接、百科内容简介。 注:当前只支持单主体识别,若图片中有多个车辆,则识别目标最大的车辆。 |
| image_multi_object_detect | 图像多主体检测 | 检测出图片中多个主体,并给出位置、标签和置信得分。 |
| image_single_object_detect | 图像单主体检测 | 用户向服务请求检测图像中的主体位置。 |
| image_currency | 货币识别 | 识别图像中的货币类型,以纸币为主,正反面均可准确识别,接口返回货币的名称、代码、面值、年份信息;可识别各类近代常见货币,如美元、欧元、英镑、法郎、澳大利亚元、俄罗斯卢布、日元、韩元、泰铢、印尼卢比等。 注意:图片中货币要清晰可见。 |
| image_dish | 菜品识别 | 用于菜品识别。即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片的菜品名称、卡路里信息、置信度。 |
| image_plant | 植物识别 | 该请求用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出植物识别结果。 |
| image_landmark | 地标识别 | 该请求用于识别地标,即对于输入的一张图片(可正常解码,且长宽比适宜),输出图片中的地标识别结果。 |
| image_animal | 动物识别 | 该请求用于识别一张图片,即对于输入的一张图片(可正常解码,且长宽比较合适),输出动物识别结果。 |
| object_recognition | 看图识万物 | 基于视觉专家模型与多模态大模型技术实现万物精准识别,支持针对图像中的主体内容进行通识性知识问答,覆盖动植物、名人、影视、汽车、商品、文物等各类主体类型,整合权威百科及实时网络信息,输出高时效性、多维度的精准答案。 |
评价此篇文章
