【企业服务】图像结构化信息提取
更新时间:2024-11-12
目录
应用简介
【图像结构化信息提取】是一款基于OCR识别+大模型的智能体应用,能提取发票、车票、服装吊牌等字段内容,并以json格式输出(以下案例以识别出租车发票为例),解决票据信息需要手动填写并且还可能填写错误的问题,提高票单据的录入速度以及准确率,移动端、网页端均可便捷使用
背景情况:
- 票据信息需要手动填写并且还可能填写错误
应用价值:
- 提高票单据的录入速度以及准确率
基本操作流程:
- 第一步:在对话框内上传单据的图片
- 第二步:输入文本“请帮我识别图片中的信息”等需要获取的票据内容,应用就会为您自动提取
快来试试吧 >> 前往体验
开发指导
前期准备
1.环境准备:先注册百度智能云账号并登录千帆AppBuilder
2.资料准备:该应用仅涉及官方组件,无需额外资料
应用开发
在AppBuilder工作台页面,点击「创建应用」按钮进入开发页面。
【基本信息】
- 填写应用名称和应用描述,以及配上合适的头像(Tips:可以通过AI自动生成哦)
- 在「角色指令」版块,填写要求与规范,示例如下:
#角色设定
作为一个出租车发票信息提取员,你的任务是从阅读、理解、分析图片,从中提取关键信息,并将其按照要求调整为标准的输出形式,最终以json格式进行输出。
#组件能力
你可以应用OCR识别能力,提取图片信息。
#要求与限制
1.你需要分析图片内容,从中提取出「发票抬头、发票代码、发票号码、出租车单位、电话、车牌号、日期、时间、单价、里程、实收金额」的信息
2.你需要参照输出示例将其按照json格式进行输出
3.根据发票抬头所属省份完善车牌号,输出车牌号需完整,如:京PA8888
4.出租车单位如没有,则输出为空即可。
#输出示例
json
{
'发票抬头': '北京市出租汽车专用发票',
'发票代码': '111000000000',
'出租车单位': '1015',
'车牌号': '京BM6666',
'日期': '2024-07-16',
'时间': '23:04-23:26',
'单价': '2.76',
'里程': '8.6',
'实收金额': '34.00'
}
【能力扩展】
- 在「组件」版块,添加需要的组件。
- 通用文字识别-高精度版:识别票单据内容并提取
- 添加「开场白」,让其他用户了解应用使用方式。
您好,请上传一张出租车发票的图片,我将为您提取其中的文本信息,例如发票抬头、发票代码、发票号码、日期、里程、实收金额等信息,并以JSON格式输出
应用调试
经过前边的流程,基本已经完成了应用的搭建,现在一起来验证一下应用是否可用吧。
【票据样例】
【问题样例】
- 请帮我识别上传的车票信息
- 车票金额事多少
- 发票代码是多少
应用发布
调试好应用之后,就可以发布啦。
如需获取更多应用开发资源,请联系我们