社交文娱】图片诗意描述器 目录 应用简介 开发指导 2.1 前期准备 2.2 应用开发 2.3 应用调试 2.4 应用发布 应用简介 【图片诗意描述器】是一款基于OCR识别+大模型的智能体应用,能以优美的语句描述图片场景,解决图片数量过多,人工描述图片场景效果参差不齐且人工成本费用高昂的问题,可迅速的完成大量图片场景描述且成本低。
更新指定用户的图片 接口描述 本接口用于向EVS中心静态人脸库中的指定用户更新图片,需要先请求获取图片上传链接接口并上传好图片,然后用返回的key替换此处的用户图片信息。 如需要添加、替换、删除指定用户的照片,均可使用此接口实现。
有标注数据集:数据集中图像和对应的标注文件一一对应,注意同一样本的图片和标注文件(生成图片的prompt)文件名需要相同。 JSON 复制 1 prompt : 一只肥胖的橘猫趴在太阳下,闭着眼睛伸懒腰,需要动漫风格。 数据文件要求 文件类型 格式要求 图片 jpg/png/bmp/jpeg,单张图片大小≤14M,边长≤4096px,长宽比≤3:1,最短边≥30px。
图片验证码及短信验证码登录 概览 IDaaS除了支持用户名密码登录、已配置的 认证源 登录外,还支持使用短信验证码登录以及使用用户名密码登录时增加图片验证码。 图片验证码 1、管理员用户进入 IDaaS > 项目 > 设置 > 个性化设置 ,点击 登录/注册 。 2、点击登录设置中的 编辑 ,打开图片验证码开关,设置图片验证码重试约束,点击 确认 。
查询图片 查询图片 接口描述 本接口根据【创建文生图任务】接口返回的 TaskID,查询图片生成状态。 建议查询时间间隔为 5 秒。 接口查询的图片地址有效期为1小时,请及时下载保存。 超过30天的任务信息将会被清理。
查询图片库中图片列表接口 查询图片库中图片列表 接口描述 本接口使用查询图片库中图片列表。
注: 「接口选择」过程中,还 需勾选「文字识别」中的「身份证识别」接口 ,用于实现身份核验流程中的身份证识别功能。如下图所示。 2.3 输入应用包名 在「文字识别包名」处选择「需要」 ,并根据您的APP应用信息填写包名。此处为必要操作,否则将无法顺利下载集成文件。 至此应用创建完成。
解决方案 百度通用文字识别支持多场景下的文字检测识别,多项ICDAR指标世界第一。支持中、英、葡、法、德、意、西、俄、日、中英混合识别,整体识别准确率高达90%以上。
水印编码 在添加水印操作中,水印的文字内容、文字字体、图片水印的水印图片名称等参数需要进行URL安全的Base64编码。编码步骤如下: 将内容编码成Base64。将结果中的部分编码替换。 将结果中的加号(+)替换成短划线(-)。 将结果中的正斜线(/)替换成下划线(_)。 将结果中尾部的所有等号(=)省略。
当选择了不同城市对应的车牌后,可以提升车牌的识别准确率。如您使用在北京,配置本地车牌为京,则当车牌检测首个文字模糊时,将模糊的字自动识别为京。 关联车辆组 需要选择对应的车辆底库进行关联,如果没有创建,则需要先去底库管理创建对应的组。 抓拍策略 包含三种:快速抓拍、离开后抓拍、间隔抓拍,默认快速抓拍,必须三选一。 1. 快速抓拍:需选择【抓拍时延】,在 [1,10] 取值,默认值1。