图像Images教程
更新时间:2024-02-22
本文介绍了如何通过千帆Python SDK,实现根据用户输入的文本生成图片。通过本文,你将了解如何创建应用、安装SDK、查看SDK文档,并通过SDK调用Stable-Diffusion-XL模型API生成图像。
实现效果
例如,希望根据文本生成图像,使用Stable-Diffusion-XL模型API可以实现此功能。
- 用户提示词:A Ragdoll cat with a bowtie
- 调用Stable-Diffusion-XL模型API后,可以展示生成的图像,如下图所示:
前期准备
在开始本教程操作步骤之前,需要完成以下准备工作:
- 确保已完成注册百度智能云账号。
- 确保已安装了Python,千帆SDK 支持 Python >= 3.7版本
步骤简介
步骤一:创建千帆应用。
步骤二:安装SDK。
步骤三:查看SDK文档。
步骤四:修改示例代码参数。
步骤五:运行代码。
步骤一:创建千帆应用
说明:如果已有应用,此步骤可跳过。
(1)登录百度智能云千帆控制台。
请您注册并登录百度智能云千帆控制台 。
注意:为保障服务稳定运行,账户最好不处于欠费状态。
(2)创建千帆应用
进入控制台创建应用 。
步骤二:安装SDK
说明:如果已安装SDK,此步骤可跳过。
使用以下命令安装千帆SDK和相关依赖
pip install qianfan
# 安装依赖
pip install pillow
步骤三:查看SDK文档
找到需调用的SDK文档。
例如,本文示例希望输入的文本生成图片。在千帆SDK使用说明介绍,查找调用该模型所对应的文档,并点击跳转到图像image页。
如果比较了解SDK功能,可以通过左侧导航栏直接查看图像image页,如下。
步骤四:修改示例代码参数
(1)在图像image页,查看支持模型列表,并找到调用示例
查看示例代码,并点击复制代码。
也可以直接复制以下代码
import os
import qianfan
from PIL import Image
import io
# 使用安全认证AK/SK鉴权,通过环境变量方式初始化;替换下列示例中参数,安全认证Access Key替换your_iam_ak,Secret Key替换your_iam_sk
os.environ["QIANFAN_ACCESS_KEY"] = "your_iam_ak"
os.environ["QIANFAN_SECRET_KEY"] = "your_iam_sk"
t2i = qianfan.Text2Image()
resp = t2i.do(prompt="A Ragdoll cat with a bowtie.", with_decode="base64")
img_data = resp["body"]["data"][0]["image"]
img = Image.open(io.BytesIO(img_data))
img.show(img)
(2)复制代码到本地
开发者将代码复制到本地环境,如下图所示。
(3)修改相关参数值
需要修改初始化相关值、prompt等值,如下所示:
参数名称 | 修改前的值 | 修改后的值 |
---|---|---|
QIANFAN_ACCESS_KEY | your_iam_ak | · 示例:ALTAKRG****HTRtGVgO · 如何获取该参数值: 在百度智能云控制台-用户账户-安全认证页,查看Access Key、Secret Key。 |
QIANFAN_SECRET_KEY | your_iam_sk | · 示例:c05e36c**da79f8 · 如何获取该参数值: 在百度智能云控制台-用户账户-安全认证页,查看Access Key、Secret Key。 |
prompt | A Ragdoll cat with a bowtie. | 设置用户希望图片包含的元素prompt提示词,本文示例无需修改此参数值 |
with_decode | base64 | 是否自动decode,如果不指定将返回原始的based64 encoded二进制数据,本文示例无需修改此参数值 |
(4)确认已修改示例代码各参数值
将步骤(3)获取的Access Key、Secret Key、AppID、content等值,修改为实际使用值,如下图所示。
步骤五:运行代码
运行代码,调用成功后,展示生成的图片,如下图所示。