通用文字识别
1.0折起支持识别10种常见语言,使用成本更低,经济实惠。
接口
标准版
规格
1000次
购买方式
按次数包
有效期
1年
立即购买
iOCR通用版
3.0折起针对固定版式的卡证、票据、文件,自助创建识别模板和分类器,并结构化输出识别结果。
立即购买
OCR共享资源包
7.0折起支持OCR多产品跨接口使用(核验类接口、智能文档平台除外)。
立即购买
身份证识别
1.0折起结构化识别二代居民身份证正反面所有8个字段,识别准确率超过99%。
立即购买
增值税发票识别
1.0折起结构化识别增值税普票、专票、电子发票、卷票、区块链发票的所有关键字段,五要素识别准确率超过99%。
立即购买
文档解析
3.0折起支持输出doc、pdf、xlsx等16种格式文档的版面、表格、阅读顺序等信息。
立即购买
通用文字识别(标准含位置版)
3.0折起支持10种常见语言,可返回文字位置信息,方便二次处理。
接口
通用文字识别(标准含位置版)
规格
1万次
有效期
12个月
立即购买
通用文字识别(高精度版)
3.0折起更高精度的整图文字识别,支持20余种语言。
接口
通用文字识别(高精度版)
规格
1万次
有效期
12个月
立即购买
通用文字识别(高精度含位置版)
3.0折起更高精度的整图文字识别,返回文字在图片中的位置信息。
接口
通用文字识别(高精度含位置版)
规格
1万次
有效期
12个月
立即购买
人脸离线识别SDK
6.1折起设备端本地化人脸检测与采集、活体检测、人脸识别功能。
规格
20-50个
购买方式
单设备/批量授权
有效期
永久
立即购买
人脸离线识别SDK
7.0折起设备端本地化人脸检测与采集、活体检测、人脸识别功能。
规格
100-499个
购买方式
单设备/批量授权
有效期
永久
立即购买
人脸离线识别SDK
6.8折起设备端本地化人脸检测与采集、活体检测、人脸识别功能。
规格
500-999个
购买方式
单设备/批量授权
有效期
永久
立即购买
图像主体检测(单主体)
1.0折起检测图片中的主体,可识别出图片中主体的位置和标签
立即购买
通用物体和场景识别
3.0折起识别10万类物体和场景,返回大类及细分名称、百科信息。
立即购买
动物识别
3.0折起识别近八千种动物,返回动物名称、百科信息。
接口
动物识别
规格
1万次
购买方式
按次数包
时长
12个月
立即购买
图像内容理解
5.0折起多维度识别图片内容,包括人、物、行为、场景、文字等,并输出一句话描述。
立即购买
相似图片搜索-检索
5.0折起在自建图库中找到与检索图片语义相似的图片集,并给出相似度打分(综合图片类型、颜色、内容、布局等特征)
接口
相似图片搜索-检索
规格
10万次
购买方式
按次数包
时长
12个月
立即购买
商品图片搜索-入库
5.0折起针对商品类图片,专项训练检索模型,在自建图库中搜索相同及相似的商品图片集。
接口
商品图片搜索-入库
规格
10万次
有效期
12个月
立即购买
语音翻译
7.0折起将60秒以内的语音识别成文字并翻译成目标语言。
立即购买
图片翻译
7.0折起结合OCR及机器翻译,对图片内文本进行翻译及译文实景回填。
立即购买
文档翻译
7.0折起支持Word、PDF等常见文档翻译,文档样式高度还原。
立即购买
短语音识别极速版
3.0折起将60秒内的中文普通话音频快速识别为文字,实时返回识别结果,适用于手机语音搜索、聊天输入等场景。
立即购买
实时语音识别-中文普通话
1.0折起将音频流实时识别为文字,并返回每句话的开始和结束时间。
接口
实时语音识别-中文普通话
规格
10小时
有效期
12个月
立即购买
音频文件转写-中文普通话
1.0折起将批量上传的音频文件识别为文字,12小时内返回识别结果,适合录音质检、会议内容总结等场景。
接口
音频文件转写-中文普通话
规格
10小时
有效期
12个月
立即购买
短文本在线合成-基础音库
3.0折起可将文本转换为音频,支持4种音库,为您提供高性价比的语音合成服务。
接口
短文本在线合成-基础音库
规格
1万次
有效期
12个月
立即购买
短文本在线合成-臻品音库
3.0折起将文本转换为极致拟人、情感饱满的音频,提供逾30种音库可选。
接口
短文本在线合成-臻品音库
规格
1万次
有效期
12个月
立即购买
长文本在线合成-大模型音库
5.0折起提供22种大模型音库,最高支持将10万字文本快速转换成稳定流畅、饱满真实的音频
接口
大模型音库
规格
10万字符
购买方式
按字符包
时长
12个月
立即购买