图像Images教程
更新时间:2024-11-11
本文介绍了如何通过千帆ModelBuilder Python SDK,实现根据用户输入的文本生成图片。通过本文,你将了解如何通过SDK调用Stable-Diffusion-XL模型API生成图像。
实现效果
例如,希望根据文本生成图像,使用Stable-Diffusion-XL模型API可以实现此功能。
- 用户提示词:A Ragdoll cat with a bowtie
- 调用Stable-Diffusion-XL模型API后,可以展示生成的图像,如下图所示:
前期准备
在开始本教程操作步骤之前,需要完成以下准备工作:
- 确保已完成注册百度智能云账号。注意:为保障服务稳定运行,账户最好不处于欠费状态。
- 确保已安装了Python,SDK支持 Python >= 3.7版本
- 平台已默认开通API调用权限,无需申请授权。
步骤一:安装SDK
说明:如果已安装SDK,此步骤可跳过。
使用以下命令安装SDK和相关依赖
pip install qianfan
# 安装依赖
pip install pillow
步骤二:查看示例代码
例如,本文希望调用Stable-Diffusion-XL模型API能力。
(1)复制示例代码。
点击查看Stable-Diffusion-XL文档,并点击复制示例代码,代码如下。
import os
import qianfan
from PIL import Image
import io
# 使用安全认证AK/SK鉴权,通过环境变量方式初始化;替换下列示例中参数,安全认证Access Key替换your_iam_ak,Secret Key替换your_iam_sk
os.environ["QIANFAN_ACCESS_KEY"] = "your_iam_ak"
os.environ["QIANFAN_SECRET_KEY"] = "your_iam_sk"
t2i = qianfan.Text2Image()
resp = t2i.do(prompt="A Ragdoll cat with a bowtie.", with_decode="base64",model="Stable-Diffusion-XL")
img_data = resp["body"]["data"][0]["image"]
img = Image.open(io.BytesIO(img_data))
img.show(img)
(2)将代码复制到本地环境,如下图所示。
步骤三:修改示例代码
需要修改初始化相关值、prompt等值,如下所示:
参数名称 | 修改前的值 | 修改后的值 |
---|---|---|
QIANFAN_ACCESS_KEY | your_iam_ak | · 示例:ALTAKRG****HTRtGVgO · 如何获取该参数值: 在百度智能云控制台-用户账户-安全认证页,查看Access Key、Secret Key。 |
QIANFAN_SECRET_KEY | your_iam_sk | · 示例:c05e36c**da79f8 · 如何获取该参数值: 在百度智能云控制台-用户账户-安全认证页,查看Access Key、Secret Key。 |
prompt | A Ragdoll cat with a bowtie. | 设置用户希望图片包含的元素prompt提示词,本文示例无需修改此参数值 |
with_decode | base64 | 是否自动decode,如果不指定将返回原始的based64 encoded二进制数据,本文示例无需修改此参数值 |
修改相关参数后,如下图所示。
步骤四:运行代码
运行代码,调用成功后,展示生成的图片,如下图所示。