支持MCP接入的文字识别工具清单
更新时间:2026-03-10
支持MCP接入的通用文字识别工具清单
| 工具名称 | 工具描述 | 功能说明 |
|---|---|---|
| ocr_general_accurate_location | 通用文字识别(高精度含位置版) | 提供多场景、多语种、高精度的整图文字检测和识别服务,支持生僻字识别,并支持20种语言识别,相对于通用文字识别(含位置信息版)该产品精度更高,但是识别耗时会稍长。 |
| ocr_handwriting | 手写文字识别 | 支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上。 |
| ocr_office_doc | 办公文档识别 | 可对办公类文档版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持中、英两种语言,手写、印刷体混排多种场景。 |
| ocr_web_image_location | 网络图片文字识别(含位置版) | 支持识别艺术字体或背景复杂的文字内容,除文字信息外,还可返回每行文字的位置信息、行置信度,以及单字符内容和位置等。 |
| ocr_qrcode | 二维码识别 | 对图片中的二维码、条形码进行检测和识别,返回存储的文字信息。 |
| ocr_digits | 数字识别 | 对图片中的数字进行提取和识别,自动过滤非数字内容,仅返回数字内容及其位置信息,识别准确率超过99%。 |
| ocr_seal | 印章识别 | 检测并识别合同文件或常用票据中的印章,输出文字内容、印章位置信息以及相关置信度,支持识别印章编码,可覆盖圆形章、椭圆形章、方形章等常见种类的印章。 |
| ocr_table | 表格文字识别V2 | 支持识别图片/PDF格式文档中的表格内容,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息,全面覆盖各类表格样式,包括常规有线表格、无线表格、含合并单元格表格。同时,支持多表格内容识别。 |
| ocr_meter_reading | 仪器仪表盘读数识别 | 适用于不同品牌、不同型号的仪器仪表盘读数识别,广泛适用于各类血糖仪、血压仪、燃气表、电表等,可识别表盘上的数字、英文、符号,支持液晶屏、字轮表等表型。 |
| ocr_structure | 智能结构化 | 支持智能提取图片中的字段结构化信息,无需训练灵活提取。适用于各类证照、票据、表单等版式中的结构化信息录入场景。 |
| ocr_file_classify | 文件检测分类 | 对图片中的文档、卡证、票据等含文字的主体进行检测、分类,可同时支持一张图片中多张主体的情况,返回每个主体的类别及位置信息。 |
支持MCP接入的文档解析工具清单
| 工具名称 | 工具描述 | 功能说明 |
|---|---|---|
| document_parse | 文档解析 | 支持对doc、pdf、图片、xlsx等18种格式文档进行解析,输出文档的版面、表格、阅读顺序、标题层级、旋转角度等信息,支持中、英、日、韩、法等20余种语言类型,可返回Markdown格式内容,将非结构化数据转化为易于处理的结构化数据,识别准确率可达 90% 以上。 |
支持MCP接入的财务医疗票据识别工具清单
| 工具名称 | 工具描述 | 功能说明 |
|---|---|---|
| ocr_medical_settlement | 医疗费用结算单识别 | 支持识别全国医疗费用结算单的姓名、出/入院时间、发票总金额、自费金额、医保支付金额等 6 个关键字段,其中北京地区票据识别效果最佳。 |
| ocr_vat_verify | 增值税发票验真 | 支持9种增值税发票的信息核验,包括增值税专票、电子专票、普票、电子普票、卷票、通行费增值税电子普通发票、货物运输业增值税专用发票、机动车销售发票、二手车销售发票等,支持返回票面的全部信息。同时可直接与同平台的发票识别能力对接,完成发票识别的同时进行自动化验真。 |
| ocr_medical_expense | 医疗费用明细识别 | 支持识别全国医疗费用明细小票的姓名、日期、病人ID、总金额等关键字段,支持识别费用明细项目,其中北京地区识别效果最佳。 |
| ocr_medical_invoice | 医疗发票识别 | 支持识别全国各地门诊/住院发票的 业务流水号、发票号、住院号、门诊号、病例号、姓名、性别、社保卡号、金额大/小写、收款单位、省市、医保统筹支付、个人账户支付 等关键字段,其中北京/广东/河北/河南/江苏/山东/上海/天津/浙江等地区票据识别效果较佳。支持识别收费项目明细,并可根据不同省市地区返回对应的识别参数。 |
| ocr_finance_receipt | 智能财务票据识别 | 支持财务场景中13种常见票据的分类及结构化识别,包括增值税发票、卷票、机打发票、定额发票、火车票、出租车票、网约车行程单、飞机行程单、汽车票、过路过桥费、船票、机动车/二手车销售发票。支持多张不同种类票据在同一张图片上的混贴场景,可返回每张票据的位置、种类及票面信息的结构化识别结果。 |
支持MCP接入的个人证照识别工具清单
| 工具名称 | 工具描述 | 功能说明 |
|---|---|---|
| ocr_passport_international | 护照识别(港澳台地区及境外) | 支持对港澳台地区及境外护照进行结构化识别,包括MRZCode1、MRZCode2、出生日期、国家码、国籍、姓名拼音、性别、护照号、护照类型、有效期,10 个关键字段。 |
| ocr_driving_license | 驾驶证识别 | 支持对机动车驾驶证正页及副页所有15个字段进行结构化识别,包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位、档案编号等。 |
| ocr_social_security | 社保卡识别 | 支持识别全国各地社保卡,其中北京/河北等地区的识别效果最佳,支持识别社会保障卡号、姓名、性别、出生日期、银行卡号、有效期限等8个字段。 |
| ocr_birth_cert | 出生医学证明识别 | 支持对出生医学证明的6个关键字段进行结构化识别,包括新生儿姓名、性别、出生时间、父亲姓名、母亲姓名、出生证编号。 |
| ocr_property_cert | 房产证识别 | 支持对房产证进行结构化识别,包括权利人、坐落、权利类型、面积、字第号 、不动产单元号、共有情况、用途、使用期限 、登记日期、共有人,全部 11 个字段。 |
| ocr_hk_mo_tw_cert | 港澳台证件识别 | 支持识别4类港澳台出入境证件识别,包含港澳通行证正/反面、台湾通行证正/反面、台胞证(台湾居民来往大陆通行证)正/反面、返乡证(港澳居民来往内地通行证)正/反面,可支持识别以上4类证件的全部字段信息。 |
| ocr_household_register | 户口本识别 | 支持对户口本内常住人口登记卡的全部 22 个字段进行结构化识别,包括户号、姓名、与户主关系、性别、出生地、民族、出生日期、身份证号、本市县其他住址、曾用名、籍贯、宗教信仰、身高、血型、文化程度、婚姻状况、兵役状况、服务处所、职业、何时由何地迁往本市、何时由何地迁往本址、登记日期。 |
| ocr_id_card | 身份证识别 | 支持对二代居民身份证正反面所有8个字段进行结构化识别,包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限,识别准确率超过99%;同时支持身份证正面头像检测,并返回头像切片的base64编码及位置信息。 同时,支持对用户上传的身份证图片进行图像风险和质量检测,可识别图片是否为复印件或临时身份证,是否被翻拍或编辑,是否存在正反颠倒、模糊、欠曝、过曝等质量问题。 |
| ocr_passport | 护照识别 | 支持对中国大陆护照个人资料页所有15个字段进行结构化识别,包括国家码、护照号、姓名、姓名拼音、性别、出生地点、出生日期、签发地点(不支持境外签发地)、签发日期、有效期、签发机关、护照类型、国籍、MRZCode1、MRZCode2。 |
| ocr_marriage_cert | 结婚证识别 | 支持对结婚证进行结构化识别,包括姓名男、身份证件号男、出生日期男、国籍男、性别男、姓名女、身份证件号女、出生日期女、国籍女、性别女、结婚证字号、持证人、备注、登记日期,全部 14 个字段。 |
| ocr_divorce_cert | 离婚证识别 | 支持对离婚证进行结构化识别,包括姓名男、身份证件号男、出生日期男、国籍男、性别男、姓名女、身份证件号女、出生日期女、国籍女、性别女、离婚证字号、持证人、备注、登记日期,全部 14 个字段。 |
| ocr_bank_card | 银行卡识别 | 支持对主流银行卡的卡号、有效期、发卡行、卡片类型4个关键字段进行结构化识别,识别准确率超过99%。 |
支持MCP接入的企业证照识别工具清单
| 工具名称 | 工具描述 | 功能说明 |
|---|---|---|
| ocr_food_business_permit | 食品经营许可证识别 | 支持对食品经营许可证进行结构化识别,包括经营者名称、社会信用代码、法定代表人、住所、经营场所、主体业态、经营项目、有效期至、许可证编号、日常监督管理机构、日常监督管理人员、发证机关、签发人、签发日期,全部 14 个字段。 |
| ocr_business_license | 营业执照识别 | 支持对不同版式营业执照的证件编号、社会信用代码、单位名称、地址、法人、类型、成立日期、有效日期、经营范围等关键字段进行结构化识别。 |
| ocr_account_permit | 开户许可证识别 | 支持对开户许可证进行结构化识别,包括公司名称、开户银行、核准号、法人、编号、账号,全部 6 个字段。 |
| ocr_food_produce_permit | 食品生产许可证识别 | 支持对食品生产许可证进行结构化识别,包括生产者名称、社会信用代码、法定代表人、住所、生产地址、食品类别、有效期至、许可证编号、日常监督管理机构、日常监督管理人员、投诉举报电话等信息、发证机关、签发人、签发日期,全部 14 个字段。 |
支持MCP接入的车辆证照识别工具清单
| 工具名称 | 工具描述 | 功能说明 |
|---|---|---|
| ocr_vin | VIN码识别 | 支持对车辆挡风玻璃处的车架号码进行识别。 |
| ocr_vehicle_cert_mix | 车辆证照混贴识别 | 车辆证照混贴识别接口支持自动检测与识别行驶证、驾驶证混贴图片,即识别机动车行驶证主页及副页、机动车驾驶证主页及副页在同一张图片上的场景,一次性识别图片中多个行驶证、驾驶证的所有字段。 支持对机动车行驶证主页及副页所有22个字段进行结构化识别,包括号牌号码、车辆类型、所有人、品牌型号、车辆识别代码、发动机号码、核定载人数、质量、尺寸、检验记录等;支持对机动车驾驶证正页及副页所有15个字段进行结构化识别,包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位、档案编号等。 |
| ocr_vehicle_registration | 机动车登记证书识别 | 支持对机动车登记证书的15个关键字段进行结构化识别,包括编号、机动车所有人、登记机关、登记日期、登记编号、车辆类型等,同时支持检测发证机关章。 |
| ocr_vehicle_qualification | 车辆合格证识别 | 支持对车辆合格证的28个关键字段进行结构化识别,包括合格证编号、发证日期、车辆制造企业名、车辆品牌、车辆名称、车辆型号、车架号、车身颜色、发动机型号、发动机号、燃料种类、排量、功率、排放标准、轮胎数、轴距、轴数、转向形式、总质量、整备质量、驾驶室准乘人数、最高设计车速、车辆制造日期等。 |
| ocr_road_transport | 道路运输证识别 | 结构化识别道路运输证的业户名称、地址、车辆号牌、经营许可证、经济类型、车辆类型、吨座位、车辆规格、经营范围、初领日期、备注、发证日期等14个关键字段,支持识别横版及竖版两种道路运输证。 |
| ocr_license_plate | 车牌识别 | 支持识别中国大陆机动车蓝牌、黄牌(单双行)、绿牌、大型新能源(黄绿)、领使馆车牌、警牌、武警牌(单双行)、军牌(单双行)、港澳出入境车牌、农用车牌、民航车牌的地域编号和车牌号,并能同时识别图像中的多张车牌。 |
支持MCP接入的教育文字识别工具清单
| 工具名称 | 工具描述 | 功能说明 |
|---|---|---|
| ocr_exam_analysis | 试卷分析与识别 | 可对文档版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持中、英两种语言,手写、印刷体混排多种场景。 |
