logo
插件logo

智慧图问

前往使用

智慧图问

插件功能

图片解析插件,主要功能为图片理解与识别,并对图片内容进行总结概述,输出用户可理解的自然语言文本描述(句子或段落)。 识别能力包含文字OCR解析、人物识别、植物识别、商品识别、车辆识别等等。其中,

  • 文字OCR可对网页截图、办公文档、表格、题目公式、海报广告等进行解析;
  • 人物识别包含演员、歌手、企业家等公众人物,可参考百度百科词条人物(不包含国内国际政要等敏感人物);
  • 植物识别能力可识别常见的树木、花卉、农作物等;商品识别能力可输出常见商品名称;
  • 车辆识别包含常见车型、品牌以及颜色等属性。另外,针对通用图片,本插件可输出简要图片内容描述,包含图片人物的表情动作描述、物品状态属性描述、景物风景描述等。满足智能AI应用在视觉感知能力的扩展与交互。

插件配置

image.png

可选择进行基础配置,填入提示词。

image.png

使用效果

此插件支持上传文件进行测试,如下所示:

image.png

支持上传jpg、jpeg、png、bmp、webp格式的文件,文档不得超过10M,仅支持单文件上传,以下为测试效果:

image.png