介绍文字识别的功能和一般使用场景
支持MCP接入的财务医疗票据识别工具清单 工具名称 工具描述 功能说明 ocr_medical_settlement 医疗费用结算单识别 支持识别全国医疗费用结算单的姓名、出/入院时间、发票总金额、自费金额、医保支付金额等 6 个关键字段,其中北京地区票据识别效果最佳。
语音转文字(FireRed) 简介 语音识别模块 - 基于 FireRed ASR 模型的多语言语音转文字解决方案 功能描述 多语言识别:支持中英文、以及中文方言 多模型选择:支持多种模型,包括AED模型和LLM模型 音频类型: 支持单声道、16K采样率的wav音频文件 为保证识别效果,对于AED模型,建议音频长度不超过60s;对于LLM模型,建议音频长度不超过30s 使用LLM进行批量推理时,建议确保音频长度差异不大
磅单识别 接口描述 结构化识别磅单的车牌号、打印时间、毛重、皮重、净重、发货单位、收货单位、单号8个关键字段,现阶段仅支持识别印刷体磅单。 在线调试 您可以在 示例代码中心 中调试该接口 ,进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 请求说明 请求示例 HTTP 方法: POST 请求URL:
食品生产许可证识别 该接口已停止更新且即将下线,为避免影响您目前的业务使用,请您及时进行相关迁移工作 接口描述 支持对食品生产许可证进行结构化识别,包括生产者名称、社会信用代码、法定代表人、住所、生产地址、食品类别、有效期至、许可证编号、日常监督管理机构、日常监督管理人员、投诉举报电话等信息、发证机关、签发人、签发日期,全部 14 个字段。
食品经营许可证识别 该接口已停止更新且即将下线,为避免影响您目前的业务使用,请您及时进行相关迁移工作 接口描述 支持对食品经营许可证进行结构化识别,包括经营者名称、社会信用代码、法定代表人、住所、经营场所、主体业态、经营项目、有效期至、许可证编号、日常监督管理机构、日常监督管理人员、发证机关、签发人、签发日期,全部 14 个字段。
按量后付费 月调用量 医疗费用明细识别(元/次) 不限量 1.2 说明: “调用次数”只包括成功调用,调用失败不计费 医疗费用结算单识别 已完成实名认证的用户,登录进入文字识别控制台,即可自动获取所需接口的免费测试资源。 个人认证 200 次,企业认证 500 次。 免费测试资源用尽后按照如下价格进行计费。如需付费使用,可 购买次数包 或 开通按量后付费 。
门脸文字识别 接口描述 针对含有门脸/门头的图片进行专项优化,支持识别门脸/门头上的文字内容。 在百度云控制台的位置 进入 文字识别的的百度云控制台概览页面 ,门脸文字识别在如下图所示位置: 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
教育场景文字识别 试卷分析与识别 已完成实名认证的用户,登录进入文字识别控制台,即可自动获取所需接口的免费测试资源。 个人认证 500 次,企业认证 1,000 次。 免费测试资源用尽后按照如下价格进行计费。
WriteLine ( 手写文字识别: ) ; 30 Console .