logo

【千帆应用】卡通头像制作使用workflow工作流编排的API节点输出文生图过程讲解

背景

通过调用自定义的组件进行文生图的分享例子比较少,
因此,在这里简单分享下博主这款应用是如何实现返回图片。
在返回过程中也遇到一些小问题,比如是返回什么样格式的图片才会自动解析并显示?
直接是URL图片地址文本?还是需要html格式的图片?是否支持自己服务器下的域名图片?
带着这些疑问,我们一起探索下。
我在百度智能云千帆AppBuilder开发了一款AI原生应用,快来使用吧!「卡通头像制作」:https://appbuilder.baidu.com/s/GhTqeLmB

应用配置信息

应用和组件联动有两点很重要,一个是Prompt描述,一个是组件的描述,这两个都会很明确给LLM表明了意图,就是生成图片。

优化组件

昨天线上会议,官方提到节点也可以添加文生图组件,今天就在节点直接加上文生图组件进行了尝试,效果非常不错。
博主加了一个代码节点,因为不经过自己服务器了,所以需要加一个代码节点来限定只能输出【卡通图】风格的图片。

官方文生图组件

官方这款文生图组件也是非常强大,可能是里面运用了很多生成高质量图片算法,会相对慢一点,
这一次体验发现官方对这个组件优化了很多,速度上能够明显感觉快了,快去体验吧。
博主想通过自定义一个组件进行返回文生图,就想到了官方是这个文生图组件,目的是想看下它返回的参数格式和内容。
返回的内容格式就是URL图片地址文本
通过使用和体验,你会发现返回来的图片效果非常逼真和高清,我猜测它除了我们基础的描述外,还有很多prompt修饰词

验证图片输出

通过上面观察官方返回的图片格式是URL字符串,猜测是不是在组件返回内容里包含图片地址字符串就行,来验证下。
在自己服务器上创建一个文件夹,并放一张图片,只要调用了组件就返回这个域名下的图片看下效果如何
通过返回结果,大概能够推断,只要组件返回了图片URL就能够被解析和显示(之前不行可能是因为这次优化升级了)

Web服务器

因为博主用的后端语言是C#,所以基本都是使用微软全家桶,服务器操作系统就是windows,web服务器就是IIS。
对于学习Python小伙伴,在 Linux 系统上部署 Python Web 应用,通常会使用像 Apache、Nginx、或者 Gunicorn 这样的 Web 服务器。
对于学习Java小伙伴,在 Linux 系统上部署 Java Web 应用程序通常需要安装一个 Servlet 容器或应用服务器,如 Apache Tomcat 或 Jetty。
下面就是博主部署API接口IIS(Web服务器)
对于没有学过编程或者正在学的小伙伴估计有一定难度,可以先积累,等学会了再接入自定义API节点,否则可以尝试使用现成的一些第三方API也是可以的。加上官方组件也非常丰富,也能满足我们非编程的同学去使用和体验。

常见报错

下面的报错,大部分都是因为数据类型不对,data是字符串,但是api接口返回了dict字典类型。
这个时候,可以进入组件进行调试查看报错节点。
这里设置的输出参数data,参数类型为String字符串,应该改为Object对象类型,因为前面我们api接口就是把data改为了一个object返回参数值
解决方法,改为和api返回参数一致
最后就是调试成功后,点击发布组件

总结

这篇文章的目的还是想让大家了解,自定义组件返回文生图的一个小经验。
并且LLM应用对图片的识别率也提高了,基本上只要你返回数据里包含图片URL都能显示出来。
欢迎大家体验官方提供的文生图组件(生成图片效果非常不错,已经比之前优化了很多,并且也支持在组件里添加文生图组件作为节点)
我在百度智能云千帆AppBuilder开发了一款AI原生应用,快来使用吧!「卡通头像制作」:https://appbuilder.baidu.com/s/GhTqeLmB
如有疑问可咨询博主!答疑解惑,共同进步!
评论
用户头像