logo
1

AppBuilder:北京买什么房 - 开发体验分享

应用ID:90f2ca9f-8943-49f5-8c32-8c27b6bd04c5

开发需求:

在小红书看到了很多朋友在问"预算多少,适合买什么房子",而且最近关于北京二手房购买的政策也发生了改变所以会有更大的市场需求。本次开发的主要目的是想复刻一个链家或者贝壳找房,借助大模型的能力完成关于购房的建议。

数据准备:

通过某种途径(懂的都懂)获取了链家的二手房源信息,当然由于房价波动,数据会一直更新,这个其实接在企业的前端会好一些,AppBuilder + 企业级的房价信息数据,随着房价信息的随时波动,推荐信息也可以满足用户的需求。数据总量大概有13W条。

开发过程:

最开始的思路其实是借助数据库的方式处理大量的数据,但是构造完数据之后发现上传表的行数有要求不超过5000行,5000行哪里够啊。但是看能把表拆开,结果发现一个excel表只能传到一个数据库中,13W条数据这个要传到啥时候,而且每个数据表都要填一大堆东西。
所以转换思路,借助知识库来做,把搞来的数据贴进了txt文件里,结果发现对于txt文件还有文件大小的限制,不能超过10MB。借助split函数拆分成9MB后(特意防止极限报错),结果平台还是告诉我解析失败,后来才知道字符数太多了(也理解token太多处理不了呗)。只能按照行数来处理了。最后将13W的数据拆分到了93个文件里,传到了知识库里。
后面其实就是设计一些prompt和人设了,但是从体验上来看,直接让模型去理解这种数据还是处理的不太好。但是也算是能用了,如果问题问的细一些,还是可以得到比较符合预期的回答的。比如"回龙观400W左右的房子有哪些?"
不过其实我最开始的预期是,可以完全做成一个二手房销售顾问,你有任何问题都可以发给这个模型。感觉还是任重道远。

实现的效果:

如果数据的质量可以更高一些,我们一定可以有更好的体验效果!!!

最后的最后:

如果你想买二手房,可以用这个app来试一下。把你想问的但是效果不是很好的问题,在这篇分享下面留言。如果我能调prompt,我就来处理一下。如果不可以就交给千帆的同志来优化一下模型了。

最好可以随手帮我点一个赞,谢谢!!!

评论
用户头像