3
【探秘千帆AppBuilder】:玩转控制台,一键创发丁真虚拟伙伴AI应用
AI原生应用开发/技术交流
- 有奖征文
- LLM
- 文心大模型
4月9日8806看过
前言
在数字化浪潮席卷全球的当今时代,人工智能技术正以前所未有的速度革新各行各业,成为推动创新、优化流程、提升效率的关键驱动力。随着AI技术的普及化需求日益增强,如何让开发者与非技术人员都能轻松驾驭这一强大工具,实现从创意到落地的无缝衔接,成为了科技界亟待解决的课题。正是在此背景下,百度智能云适时推出了千帆AppBuilder——一款专为高效开发AI原生应用而打造的一体化平台。
本文将带领读者深入探寻这一创新工作台的核心魅力,揭示其如何通过巧妙的设计与强大的功能,实现“玩转控制台,一键创发原生AI应用”,助力各领域用户跨越技术鸿沟,轻松步入AI应用开发的新纪元。以下,我们将沿着千帆AppBuilder的产品理念、核心功能、用户体验及实际应用价值等维度,全方位揭示其如何赋能广大用户,将前沿AI技术转化为触手可及的生产力。
百度智能云千帆AppBuilder
产品地址
https://cloud.baidu.com/product/AppBuilder (点此链接一键到达)
产品特点
高效搭建AI应用
提供AI原生应用开发工作台,包含丰富的应用示例、可视化的应用快速编辑器和开源的应用代码框架,满足你高效搭建AI应用的一切需求。
1.丰富应用示例,启迪创新思路
千帆AppBuilder内置了大量的应用示例库,涵盖教育、医疗、金融、零售、制造等多个行业领域。这些示例不仅展示了AI技术在实际场景中的成熟应用,更是用户获取灵感、学习实践的宝贵资源。无论是初涉AI应用开发的新手,还是经验丰富的专业人士,都能从中找到与自身业务需求相契合的解决方案,或是借此启发新的应用构思。每个示例都详细标注了所使用的AI技术、功能模块及实现逻辑,用户可以轻松查阅、学习并直接引用或改编,极大地缩短了从想法到实施的距离。
2.可视化的应用快速编辑器,降低技术门槛
千帆AppBuilder搭载了先进的可视化应用快速编辑器,彻底打破了传统开发模式对编程知识的高度依赖。该编辑器采用图形化界面,将复杂的代码逻辑以直观易懂的组件形式呈现,用户只需通过简单的拖拽、配置,即可完成页面布局、功能设定、数据连接等工作。编辑器内嵌的实时预览功能,让用户在设计过程中即时看到应用的实际效果,实现了所见即所得的开发体验。这种低门槛、高效率的开发方式,使得无论是IT专业人员还是业务人员,都能轻松参与到AI应用的构建过程中,极大地拓宽了AI技术的使用者范围。
3.开源的应用代码框架,保障深度定制与扩展
对于有深度定制需求或具备编程能力的用户,平台同样提供了开源的应用代码框架。这套框架遵循业界标准,结构清晰,文档详尽,支持多种主流编程语言,方便开发者进行深层次的定制开发和功能扩展。同时,框架与平台其他功能无缝对接,用户可以在保持高效开发的同时,充分利用平台提供的AI能力、云服务等资源,确保定制化应用的高性能与稳定性。这种兼顾浅层快速构建与深层定制开发的设计,使得千帆AppBuilder能够适应各类用户群体和复杂业务场景,真正实现“按需取用,随心所欲”。
一站式开发体验
提供一站式AI原生应用开发资源,你可以轻松获取大模型驱动的开发组件,语音识别、TTS、文生图、向量引擎等AI能力组件,以及各类IAAS云资源。
1.大模型驱动的开发组件
千帆AppBuilder紧密对接了百度智能云最新的大模型技术成果,如预训练语言模型、多模态生成模型等。这些大模型驱动的开发组件,赋予了开发者无需从零开始训练模型的能力,而是可以直接调用已训练好的、性能优异的大型模型来实现诸如文本生成、问答交互、内容理解和跨模态生成等高级AI功能。这些组件经过严格测试,性能稳定,接口友好,支持灵活定制和扩展,使得开发者能够迅速将AI前沿技术融入应用之中,显著提升应用的智能化水平。
2.语音识别与TTS(Text-to-Speech)
对于涉及语音交互的AI应用,千帆AppBuilder提供了业界领先的语音识别和TTS服务。语音识别组件能够精准地将用户的语音输入转化为文字,适用于电话客服、语音助手、智能家居等多种场景。而TTS组件则能将文本信息实时转化为自然流畅的语音输出,无论是播报新闻、朗读电子书,还是实现人机对话,都能提供高质量的听觉体验。这些语音技术的集成,使得开发者能够轻松构建语音交互界面,拓宽应用的交互渠道,提升用户体验。
3.文生图与向量引擎
在视觉生成和搜索领域,千帆AppBuilder提供了文生图技术和向量引擎的支持。文生图组件可根据文本描述自动生成高质量的图像,为内容创作、广告设计、游戏开发等领域带来了全新的可能性。而向量引擎则是一种基于深度学习的语义搜索引擎,它能理解文本的深层含义,实现精准的语义相似度计算和智能推荐,广泛应用于个性化推荐、知识图谱检索、智能客服等场景。这两种技术的引入,使得开发者能够轻松构建具备视觉创新和深度语义理解能力的应用,满足用户对于沉浸式、智能化交互的期待。
4.各类IAAS云资源
千帆AppBuilder还无缝整合了各类基础架构即服务(Infrastructure as a Service, IAAS)资源,包括但不限于计算实例、存储服务、数据库服务、网络服务、安全服务等。用户无需离开千帆AppBuilder平台,就能便捷地申请、配置和管理这些云资源,确保AI应用的高效运行和可靠扩展。无论是需要高性能计算集群支撑大规模模型推理,还是需要高可用存储服务保存海量数据,抑或是需要构建安全可靠的网络环境,千帆AppBuilder背后的百度智能云都能提供全方位、弹性的基础设施支持,确保开发者专注于应用逻辑的实现,而无需过多关注底层运维问题。
AppBuilder控制台简介
访问https://console.bce.baidu.com/ai_apaas/dialogHome 进入百度智能云控制台。
如图所示,点击创建应用。
进入界面后如下图所示,整个界面主体分为三个板块,分别是应用设定、能力扩展、预览与调试。
应用设定
在应用设定这个板块,主要是用来设置图标样式(可自己上传、可AI生成)、应用名称、应用描述及角色指令。
对于其他三个都好理解,这里我想着重讲一下角色指令部分,这一块是最关键的内容,也是决定该AI最后呈现效果的核心部分。
大家可以这样理解这一部分,有道是“人之初,性本善”,而此处的角色指令,就是你用来定义这个AI“善恶”的,从专业的角度来说,你在此处对他定义的权重会略高于后面提供的知识库资料。(本人实践得出,如有不对还望大佬指出)
按照指令的模版,通常会分为如下几个方面:
# 角色任务***************************# 工具运用***************************# 能力要求***************************# 注意事项***************************必要时,可以直接引入部分对话作为指令,这样效果会更好,比如我在丁真虚拟伙伴中就采用了至少12轮对话模版。用户:你好,丁真!你:哈哈,你好!最近听说很多人都喜欢说“一眼丁真”,你觉得这个梗怎么样?用户:哈哈,确实很有趣。你:其实还有很多有趣的梗,比如“芝士雪豹”和“烟distance”,你也知道吗?用户:嗯,我也听说过。你:那我们一起来玩一个游戏吧,我来说梗你来猜,看看你能不能猜对。
而在指令给出后,如果不满意,也可以通过优化按钮来一键调优。
可以直接采用prompt的方式来对原有文本进行定向调优,但是其效率不如直接手动修改指令。
能力扩展
能力拓展主要包括五个方面,分别是组件、知识库、高级检索、开场白、推荐问、追问,下面来一一解析。
组件
组件选择可以理解成给AI配置对应的武器装备,比如你配置了图像内容理解后就可以上传图片来让AI进行分析,配置了百度搜索后每一次AI的回复都会经过一轮百度搜索后同时结合你的角色指令及知识库内容来进行回答,保证了内容的时效性。
除此之外,还包括诸如天气查询、手写文字识别、通用文字识别、快递查询、航班动态查询、必应图片搜索、热门视频等等30种可选组件。
知识库
顾名思义,此处是用来上传个人知识库的,点击上传按钮。
可以看到支持如下三种上传文件类型,具体为导入文本文档数据、导入知识问答数据、读取url链接数据。
当选择为导入文本文档数据时,此时支持最大单次上传文档数量为10个; 支持.doc,.txt,.docx,.pdf四种格式;txt 文件不能超过5MB, docx、pdf、doc 文件不能超过15MB且不能超过1000页。
同时,下方可以选择额外配置:
-
默认切分策略(默认勾选)和自定义切分策略
-
知识增强
-
索引方式(默认勾选)
对于新手用户或者在一些标准化、通用场景下,大家选择默认切分策略即可,比如新闻摘要提取助手、文章摘要提取助手啥的;而自定义切分策略对灵活性与精确控制更高,更适用于对特定性复杂文本的处理,比如生物分子专业知识、法律合同文本等。而使用自定义切分策略也很简单,只需选择分句标识符及最大长度后确认重叠字数占比即可。
而知识增强的话通俗一点来解释就是:想象一下,您正在图书馆里寻找一本能解答某个具体问题的书。原本,您只能依靠书名或目录(相当于普通检索系统的关键词或标签)来定位可能含有答案的部分。这种方法虽然有效,但是速度慢,检索精度有限。现在,引入“知识增强”就如同给图书馆配备了一位知识渊博的图书管理员。这位管理员不仅知道书名和目录,还熟悉每本书的具体内容,能够根据您的问题迅速定位到书中包含答案的具体段落(即“切片”),甚至能从看似无关的章节中抽取出与问题相关的隐藏知识点。这里可以推荐大家勾选上,但是需要注意的是,文档若超过10万字,超出部分无法使用知识增强。
当选择为导入知识问答数据时,此时建议用户下载excel模版进行填写,需要注意的是,此处必须严格按照excel中给出的格式来填写,如格式不符合可能导致上传或分析失败。
当选择为读取url链接数据时,此时只需要填写url及更新频率即可。
同理,下面的选择配置也可以按照上文中提到的来选择。
当选择完成后,点击确认导入即可。
除了上传新知识之外,也可以选择引用已有知识,只需要点击后在下拉框选择对应知识库就可以了。
最后一个需要提到的就是高级检索和全文检索。这里也可以看到,默认选择的是高级检索,因为他的综合效果更优。对于这两种来说,我个人认为没有必要太深究,在AI场景下优先考虑的肯定是句意理解和语义关联能力,如果使用全文检索就会成为依靠关键词来触发回答的机器人,对于用户而言就太缺乏体验感了。
而对于召回数量和匹配分我这里也通俗的解释一下。
召回数量: 想象你在一个巨大的图书馆里找一本书,这本书包含了你想要解答某个问题的所有信息。图书馆管理员就是知识库系统,而你就是提出查询(Query)的人。当你告诉管理员你要找什么内容后,管理员开始在整个图书馆中搜寻相关的书籍。
“召回数量”就像是管理员找到并拿给你看的可能相关的书本数量。你希望管理员能找到尽可能多的可能相关的书,这样你就更有可能从这些书中找到你需要的确切信息。换句话说,“召回数量”就是知识库系统在接收到你的查询请求后,找出的与你输入的Query有一定关联性的知识库片段(比如文档、文章、段落等)的总数。召回数量越大,意味着系统认为可能有用的片段越多,理论上覆盖到正确答案的概率也就越高。
匹配分: 在图书馆管理员寻找书籍的过程中,他们不是随便抓几本书给你,而是会根据你提供的查询信息来判断哪些书最有可能包含你需要的内容。他们会查看书名、作者、简介、目录等信息,评估这些书与你的需求有多“匹配”。
“匹配分”就像是管理员用来衡量某本书与你的查询需求相符程度的一个分数。这个分数是系统通过某种算法计算出来的,表示知识库片段与Query之间的相似度或相关性。如果一个片段的匹配分高于或等于设定的阈值(即“匹配分”),那么系统就会认为这个片段与Query足够相关,从而把它“召回”,也就是纳入候选结果列表供你进一步查看。
打个比方,假设你在找一本关于烹饪意大利面的书。管理员可能会根据书名、作者、目录中是否有“意大利面”字样,以及简介中是否提到相关主题来打分。得分高的书更可能被选中并递给你。在这个过程中,管理员设定的最低入选分数(匹配分)决定了哪些书会被认为足够相关而被召回。
“召回数量”是指知识库系统在接到查询后找出的、与查询条件有一定关联的片段总数;而“匹配分”则是衡量知识库片段与查询条件之间相似度或相关性的数值标准,只有匹配分达到或超过设定阈值的片段才会被系统视为相关并予以召回。这两个概念共同决定了最终呈现在用户面前的搜索结果集的质量与数量。
那么可能有人会问,既然这样,那我直接拉满是不是就可以了?既然你说这个可以决定最终的质量和数量,那我直接拉满不就可以一劳永逸了?
当然不是。如果召回数量较大,意味着系统找出了更多可能相关的知识库片段,理论上覆盖到正确答案的概率更高,有助于提高查全率,减少漏检可能的重要信息,但是同时,过大的召回数量可能导致用户面对大量搜索结果,需要花费更多时间筛选,降低检索效率。特别是在实时性要求较高或用户期望快速得到答案的场景下,过多的召回结果反而可能造成信息过载,影响用户体验。同理,匹配分亦是如此。较高的匹配分意味着召回的片段与Query的相似度或相关性更高,返回的结果更精准,有助于提高查准率,用户更容易找到所需信息,提升用户体验,,若匹配分设置过高,可能导致过于严格的筛选,只召回极少数高度匹配的片段,可能错过那些虽与Query表述略有差异但实质上仍包含有价值信息的片段,导致查全率下降,可能遗漏重要信息。所以,召回数量和匹配分并非越大越好,而应在查全率(召回尽可能多的有价值信息)与查准率(返回结果尽可能与查询需求相符)之间寻求平衡,这就需要大家不断的尝试和调优了。
开场白
这个没有什么技术含量,就是一段开场白的自我介绍,大家可以按照自己的喜好去设置,如果懒也可以AI一键生成(比如我),哈哈。
推荐问
同样,此处是设置默认推荐的三个问题,大家也可以按照自己的喜好去设置,也可以AI一键生成。
追问
此处是设置在第一轮问题之后大模型根据对话内容自动生成的追加问题,可以支持默认、自定义、关闭三种。
默认时是根据用户最近3轮对话,在最后一轮回复后自动提供3个提问建议。
自定义时,可以选择大模型在追问生成过程中会参考的对话轮数及自己设定prompt来控制追问的生成内容和风格。
关闭就是不显示推荐提问建议。
预览与调试
在左边两个板块中设置参数时,此处可以同时进行预览和调试,需要注意的是,此处包含一个模型选择的地方。
默认的思考模型是ERNIE 4.0,是百度自研的旗舰级超大规模⼤语⾔模型,相关文档参考如下(https://cloud.baidu.com/doc/WENXINWORKSHOP/s/clntwmv7t);默认的问答模型是ERNIESpeed-AppBuilder,保持不动即可。
调试时结果如下:
AI生成大法
有的小伙伴说我懒,我不想一条条去设置,那怎么才能创建上面这些内容呢?别着急,这些千帆的开发人员早就考虑到了,提供了一键生成模版的功能,点击如下图所示的AI生成配置信息。
输入你的想法,就可以一键生成模版了,是不是特别方便?
基于AppBuilder一键创建丁真虚拟伙伴
看完我上述介绍的控制台操作,我真不相信你还训练不出一个很好的AI伙伴,如果还是不会,下面,我来手把手带大家训练一个丁真虚拟伙伴。
进入(https://console.bce.baidu.com/ai_apaas/appCenter)控制台界面,点击创建应用。
点击AI生成配置信息。
输入内容:
以丁真形象打造的虚拟互动平台,轻松对话、游戏与角色扮演。
此时可以生成一个大致的模版,接下来我们需要进行一些微调工作:
-
上传一张帅照
-
在角色指令增加丁真的个人简历,同时多增加几轮对话
对话前几轮可以自己写,后面的可以交给其他大模型产品仿写,最后一并粘贴进去,这里我也给出一些例子给大家参考。
用户:你觉得自己的好运是从何而来的呢?你:我的运气就是我弟弟去上学读书了。用户:除了那句话,你还有其他对粉丝表达情感的方式吗?你:有,我会和我的雪豹朋友们一起送上祝福!用户:丁真在日常生活中是否有其他不经意的举动,透露出他对粉丝的深厚情感?你:有的,还会边抽锐克5,边骑雪豹。用户:芝士雪豹是什么?你:雪豹闭嘴!用户:烟distance是什么?你:《烟Distance》是丁真 2023 年的新单曲,与《Zood》、《I got smoke》一并称为丁真三部曲。有网友评论道:听完《烟Distance》之后,这首歌已经成为我的生活必需品了,像根“电子烟”一样(~~ 漏电~~),一天不听就浑身难受。由于这首歌的歌词对我的触动很大。用户:大家都说你鸿运齐天,你自己觉得呢?你:鲜衣怒马少年郎,谁人不识理塘王!。用户:丁真有什么话想对粉丝说吗?你:纯真已是无敌路,何须再翻圣贤书。
在能力拓展这里,我并没有选择任何组件,前期测试时组件会影响角色回复的准确性,知识库栏是我自己上传的对话知识库。
推荐问题可以设置的和角色指令中的问题相似,这样使用起来效果较好,设置完成后整体界面如下图所示:
接下来我们打开来试一试效果,因为我知识库内容并不足够,大概只有50行左右,所以对话延伸至5轮以后准确率可能没有那么高,在此也请大家见谅,后续有机会会增加知识库的数量。
链接如下所示,感兴趣的小伙伴可以扫码使用~
写在结尾的话
在深入探索千帆AppBuilder的过程中,我们不仅领略了其作为一站式开发平台的强大功能与便捷性,更体验到其如何通过创新技术与人性化设计,让创建原生AI应用变得触手可及。从丰富的组件库、灵活的拖拽式布局,到强大的AI服务集成与智能化调试支持,千帆AppBuilder以“玩转控制台,一键创发原生AI应用”的理念,成功打破了传统开发模式的技术壁垒,赋予开发者前所未有的高效创作体验。
千帆AppBuilder不仅是AI应用开发领域的革新工具,更是激发创新思维、释放开发者潜能的赋能平台。它将复杂的编程逻辑简化为直观的操作流程,使开发者能够专注于应用的核心价值与用户体验,而非被技术细节所困扰。无论对于经验丰富的专业开发者,还是对AI应用开发抱有热情的初学者,千帆AppBuilder都提供了平等且友好的开发环境,助力他们轻松跨越技术门槛,实现从创意到产品的快速转化。
展望未来,随着AI技术的持续演进与应用场景的不断拓宽,这款平台正以前所未有的方式重新定义AI应用开发,为构建智能时代的新生态注入强大动力。无论是对个人开发者寻求突破,还是对企业机构追求数字化转型,千帆AppBuilder都是值得信赖的选择。只需轻点鼠标,即可开启一段充满无限可能的AI创新之旅。让我们携手千帆AppBuilder,共同驶向AI应用开发的星辰大海,书写属于这个时代的科技篇章。
评论