新人专享 特惠体验

百度智能云新客专享优惠,年终盛惠好价限量抢购!活动规则

  • 文字识别
  • 人脸识别NEW
  • 语音技术
  • 图像技术
  • 智能应用
  • 机器翻译
  • 内容创作
  • 千帆大模型

通用文字识别(高精度含位置版)

更高精度的整图文字识别,返回文字在图片中的位置信息。

接口
通用文字识别(高精度含位置版)
规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

OCR共享资源包

支持OCR多产品跨接口使用(核验类接口、智能文档平台除外)。

接口

OCR共享资源包

规格
1万点
有效期

12个月

----
¥
立即购买

身份证识别

结构化识别二代居民身份证正反面所有8个字段,识别准确率超过99%。

接口
身份证识别
规格
1千次
有效期

12个月

购买数量
----
¥
立即购买

行驶证识别

结构化识别机动车行驶证主页及副页的所有22个字段信息。

接口
行驶证识别
规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

智能财务票据识别

13类常见财务票据“分类 识别 验真”一步到位,省时省力,报销无忧。

接口
智能财务票据识别
规格
1千次
有效期

12个月

购买数量
----
¥
立即购买

iOCR通用版

针对固定版式的卡证、票据、文件,自助创建识别模板和分类器,并结构化输出识别结果。

规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

文档解析

支持输出doc、pdf、xlsx等16种格式文档的版面、表格、阅读顺序等信息。

接口
文档解析
规格
100页
有效期

12个月

购买数量
----
¥
立即购买

营业执照识别

结构化识别各类版式营业执照的关键字段信息。

接口
营业执照识别
规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

人脸离线识别SDK

设备端本地化人脸检测与采集、活体检测、人脸识别功能。

规格

20-50个

购买方式

单设备/批量授权

有效期

永久

----
¥
立即购买

人脸对比V3

支持生活照、证件照、身份证芯片照、带网纹照、红外黑白照的人脸对比。

规格

10万次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

人脸搜索V3

在指定的人脸库中,找到与图中人脸最相似的人脸。

规格

10万次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

人脸搜索M:N

对一张图片中存在的 M 张人脸完成全部搜索并返回对应用户和相似度。

接口
人脸搜索M:N
规格

10万次

有效期

12个月

购买数量
----
¥
立即购买

人脸实名认证V4

连接权威数据源远程核验人脸图片+姓名+身份证号。

规格

100次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

身份证与名字比对

基于输入的姓名、身份证号,与权威数据源比对进行实名认证。

规格

100次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

在线图片活体V4

基于单张图片,判断图片中的人脸是否为二次翻拍。

规格

1万次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

人脸对比V4

对比两张图片中的人脸,并返回相似度分值。

规格

1万次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

大模型声音复刻-创建音色

上传训练音频,通过大模型声音复刻创建音色。

规格

50次

有效期

12个月

购买方式

按次数包

购买数量
----
¥
立即购买

大模型声音复刻-在线合成

通过大模型声音复刻创建得到的音色进行文本的合成。

规格

100万字符

有效期

12个月

购买方式

按次数包

购买数量
----
¥
立即购买

音频文件转写-中文普通话

将批量上传的音频文件识别为文字,12小时内返回识别结果,适合录音质检、会议内容总结等场景。

接口

音频文件转写-中文普通话

规格

10小时

有效期

12个月

购买数量
----
¥
立即购买

实时语音识别-中文普通话

将音频流实时识别为文字,并返回每句话的开始和结束时间。

接口
实时语音识别-中文普通话
规格

10小时

有效期

12个月

购买数量
----
¥
立即购买

短语音识别标准版-中文普通话

将60秒内的中文普通话音频识别为文字,适用于语音对话、语音控制、语音输入等场景。

接口

短语音识别标准版-中文普通话

规格

1万次

有效期

12个月

购买数量
----
¥
立即购买

短语音识别极速版

将60秒内的中文普通话音频快速识别为文字,实时返回识别结果,适用于手机语音搜索、聊天输入等场景。

规格

1万次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

短文本在线合成-基础音库

可将文本转换为音频,支持4种音库,为您提供高性价比的语音合成服务。

接口
短文本在线合成-基础音库
规格

1万次

有效期

12个月

购买数量
----
¥
立即购买

长文本在线合成-基础音库

提供4种基础音库,将超长文本快速转换成稳定流畅、饱满真实的音频。

接口
长文本在线合成-基础音库
规格

10万字符

有效期

12个月

购买数量
----
¥
立即购买

通用物体和场景识别

识别10万类物体和场景,返回大类及细分名称、百科信息。

规格

1万次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

图像主体检测(单主体)

检测图片中的主体,可识别出图片中主体的位置和标签。

接口
图像主体检测(单主体)
规格

1万次

有效期

12个月

购买数量
----
¥
立即购买

动物识别

识别近八千种动物,返回动物名称、百科信息。

接口
动物识别
规格

1万次

有效期

12个月

购买数量
----
¥
立即购买

图像内容理解

多维度识别图片内容,包括人、物、行为、场景、文字等,并输出一句话描述。

规格

1万次

购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

相似图片搜索-入库

在自建图库中找到与检索图片语义相似的图片集,并给出相似度打分。

接口
相似图片搜索-入库
规格

10万次

有效期

12个月

购买数量
----
¥
立即购买

商品图片搜索-入库

针对商品类图片,专项训练检索模型,在自建图库中搜索相同及相似的商品图片集。

接口
商品图片搜索-入库
规格

10万次

有效期

12个月

购买数量
----
¥
立即购买

在线咨询数字员工

适合个人或单人运营,满足日常咨询与转化需求。雇佣员工数量限 10,支持1位员工上岗。

规格

个人版

购买方式

按月

有效期

1个月

----
¥
立即购买

营销内容创作-视频套餐

高效打造视频内容,畅享60分钟视频制作,适用于新闻播报、企业营销、教育培训等多个应用场景

规格

月卡

购买方式

按月

有效期

1个月

----
¥
立即购买

一见视觉大模型 A1套餐

即开即用的专业级视觉AI应用,边缘设备统一管理,云端多模态大模型分析,人员安全、设备和环境异常等事件的查看处置。

设备

4路摄像头

大模型AI技能

5千次复判/分析

存储空间

100G

时长

1年

----
¥
立即购买

客悦智能客服轻量版

沟通更准确、更友好、更全面,秒级理解原始文档,智能客服一键上岗,大模型协助机器人运营优化,省心省力。

对话次数

1万次

有效期

1个月

AI客服数量

3

文档知识

100

----
¥
立即购买

智能外呼公有云

百度智能云客悦-智能外呼平台,是基于大模型革新的智能外呼产品。平台能够精准定位目标客群,根据任务设置自动发起外呼通话,并高效识别通话过程中的用户意图,提供高拟人、智能化的对话交互和更高效的服务。

配置信息

机械人通路

计费方式

包年包月计费

时长
1个月
----
¥
立即购买

大模型智能客服运营工程师

面向智能客服领域的从业者,结合平台实操演示,深度讲解大模型技术原理与行业实战。"课程+考试。

服务项

大模型智能客服运营工程师

购买方式

按次

购买数量
----
¥
立即购买

语音翻译

将60秒以内的语音识别成文字并翻译成目标语言。

接口

语音翻译

规格

1万次

有效期

12个月

购买数量
----
¥
立即购买

图片翻译

结合OCR及机器翻译,对图片内文本进行翻译及译文实景回填。

接口

图片翻译

规格

1万次

有效期

12个月

购买数量
----
¥
立即购买

文档翻译

支持Word、PDF等常见文档翻译,文档样式高度还原。

接口

文档翻译

规格

1000万字符

有效期

12个月

购买数量
----
¥
立即购买

文本翻译-通用版

提供200+语种互译的在线文本翻译,支持术语定制功能。

接口

文本翻译-通用版

规格

1000万字符

有效期

12个月

购买数量
----
¥
立即购买

文本翻译-词典版

翻译结果附带百万量级中英词典资源、语音合成资源。

接口

文本翻译-词典版

规格

1000万字符

有效期

12个月

购买数量
----
¥
立即购买

实时语音翻译

支持中英日韩法西泰俄等45个语种,采用WebSocket协议,将音频流实时识别为文字。支持智能断句,实时输出带有标点的语音识别结果和翻译结果,适用于直播翻译、会议翻译、跨国交流等场景。

接口

实时语音翻译

规格

100小时

有效期

12个月

购买数量
----
¥
立即购买

一念·智能创作平台SaaS

智能创作平台基于百度领先的大模型技术,致力于打造更符合企业应用场景的AIGC创作产品,将AI赋能创意设计,助力媒体、金融、汽车等行业实现高效内容创作。

套餐

创作专业会员

有效期

1个月

----
¥
立即购买

一念·智能创作平台SaaS

百度智能云一念是基于百度文心大模型打造的内容创作平台。集文、图、视频多种内容模态于一体,旨在助力企业更便捷更高效地获取内容创作灵感和营销物料。

套餐

创作旗舰会员

有效期

1个月

----
¥
立即购买

AI成片PaaS

输入图文素材,一键生成短视频,自动实现配音、添加数字人等环节。

规格
400点
购买方式

按点数包

有效期

12个月

购买数量
----
¥
立即购买

AI作画PaaS-基础版

将创意一键变成创作 ,生成不限定风格的图像,AI一下文字成画。

规格
50点
有效期

12个月

购买数量
----
¥
立即购买

AI作画极速版

基于文心大模型,4-8秒快速生成精美画作,支持多种分辨率。强大的中文语义理解,满足不同场景的创作需求。

规格

200点

有效期

12个月

购买数量
----
¥
立即购买

AI作画PaaS-高级版

模型升级,效果显著提升!支持输入图片创作,风格尺寸更丰富,作画更精美。

规格
200点
有效期

12个月

购买数量
----
¥
立即购买

内容审核通用资源包

提升业务灵活性,可在内容审核下图像、文本、短视频和长视频审核多付费接口共用。

规格
1万点
购买方式

按点数包

有效期

12个月

赠1亿ERNIE-Lite-Pro-128K
¥
立即购买

千帆大模型 Tokens量包

单条数据支持8k tokens。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

接口
DeepSeek-R1
规格

1亿

购买方式

按Tokens包

有效期

3个月

赠1万点内容审核通用资源包
¥
立即购买

千帆大模型 Tokens量包

128K超长上下文支持,优化多轮对话记忆与长文本处理,综合能力全面提升,满足深度交互需求。

接口
ERNIE-4.5-Turbo-128K
规格

1亿

购买方式

按Tokens包

有效期

6个月

赠1万点内容审核通用资源包
¥
立即购买

千帆大模型 Tokens量包

多模态能力突破,图像理解与跨模态创作显著提升,支持32K上下文并优化响应速度。

接口

ERNIE-4.5-Turbo-VL-32K

规格

1亿

购买方式

按Tokens包

有效期

6个月

赠1万点内容审核通用资源包
¥
立即购买

千帆大模型 Tokens量包

深度思考引擎升级,强化思维链与多模态协同,问答创作及复杂推理能力跨越式提升。

接口

ERNIE-X1-Turbo-32K

规格

1亿

购买方式

按Tokens包

有效期

6个月

赠1万点内容审核通用资源包
¥
立即购买

千帆大模型 Tokens量包

百度自研高性能大语言模型,上下文支持128K,通用能力优异,具备极佳的推理性能,适合作为基座模型进行精调,处理特定场景问题。

接口

ERNIE-Speed-Pro-128K

规格

1亿

购买方式

按Tokens包

有效期

12个月

赠1万点内容审核通用资源包
¥
立即购买

千帆大模型 Tokens量包

百度自研的轻量级大语言模型,上下文支持128K,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。

接口

ERNIE-Lite-Pro-128K

规格

1亿

购买方式

按Tokens包

有效期

12个月

赠1万点内容审核通用资源包
¥
立即购买

企业专享 特惠抢购

百度智能云企业实名用户专享优惠 年度好价限量抢购!活动规则

  • 文字识别
  • 大模型
  • 语音技术
  • 人脸识别
  • 机器翻译
  • 大数据/智能应用

OCR共享资源包

支持OCR多产品跨接口使用(核验类接口、智能文档平台除外)。

接口

OCR共享资源包

规格
100万点
有效期

12个月

购买数量
----
¥
立即购买

文档解析

支持输出doc、pdf、xlsx等16种格式文档的版面、表格、阅读顺序等信息。

接口
文档解析
规格
100万页
有效期

12个月

购买数量
----
¥
立即购买

身份证识别

结构化识别二代居民身份证正反面所有8个字段,识别准确率超过99%。

接口
身份证识别
规格
50万次
有效期

12个月

购买数量
----
¥
立即购买

VIN码识别

识别车辆挡风玻璃处的车架号码,可应用于4S店车辆出入库管理、车辆出租管理等场景。

接口
VIN码识别
规格
50万次
有效期

12个月

购买数量
----
¥
立即购买

文档抽取

支持OCR多产品跨接口使用(核验类接口、智能文档平台除外)。

接口
文档抽取
规格
10万页
有效期

12个月

购买数量
----
¥
立即购买

智能财务票据识别

13类常见财务票据“分类 识别 验真”一步到位,省时省力,报销无忧。

接口
智能财务票据识别
规格
20万次
有效期

12个月

购买数量
----
¥
立即购买

iOCR通用版

针对固定版式的卡证、票据、文件,自助创建识别模板和分类器,并结构化输出识别结果。

接口

iOCR通用版

规格
50万次
有效期

12个月

购买数量
----
¥
立即购买

办公文档识别离线SDK

支持版式识别、手写识别能力,将图片/PDF转换为Word文档。

接口
办公文档识别离线SDK
购买方式

按设备授权

有效期

永久

----
¥
立即购买

千帆大模型 Tokens量包

单条数据支持8k tokens。2025年3月24日最新版本,由杭州深度求索人工智能基础技术研究有限公司自研的 MoE 模型,在百科知识、数学推理等多项任务上优势突出,评测成绩在主流榜单中位列开源模型榜首。

接口

DeepSeek-V3

规格

10亿

购买方式

按Tokens包

有效期

3个月

----
¥
立即购买

千帆大模型 Tokens量包

单条数据支持8k tokens。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

接口

DeepSeek-R1

规格

10亿

购买方式

按Tokens包

有效期

3个月

----
¥
立即购买

千帆大模型 Tokens量包

性能全面升级,增强逻辑推理与抗幻觉能力,代码处理更高效,响应速度更快且成本更低。

接口

ERNIE-4.5-Turbo-32K

规格

10亿

购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

千帆大模型 Tokens量包

128K超长上下文支持,优化多轮对话记忆与长文本处理,综合能力全面提升,满足深度交互需求。

接口

ERNIE-4.5-Turbo-128K

规格

10亿

购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

千帆大模型 Tokens量包

多模态能力突破,图像理解与跨模态创作显著提升,支持32K上下文并优化响应速度。

接口

ERNIE-4.5-Turbo-VL-32K

规格

10亿

购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

千帆大模型 Tokens量包

深度思考引擎升级,强化思维链与多模态协同,问答创作及复杂推理能力跨越式提升。

接口

ERNIE-X1-Turbo-32K

规格

10亿

购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

工信部教考中心大模型证书

课程培训标准由工业和信息化部教育考试中心和百度联合发布,百度基于标准精心打造培训课程,岗位分为初、中、高三个级别,对生成式人工智能行业人才培养具有很强的指导性。

服务项
初级认证套餐
购买方式

按次

购买数量
----
¥
立即购买

大模型声音复刻-创建音色

上传训练音频,通过大模型声音复刻创建音色。

接口
大模型声音复刻-创建音色
规格
200次
有效期

12个月

购买数量
----
¥
立即购买

短语音识别标准版-中文普通话

将60秒内的中文普通话音频识别为文字,适用于语音对话、语音控制、语音输入等场景。

接口
短语音识别标准版-中文普通话
规格
1000万次
有效期

12个月

购买数量
----
¥
立即购买

短语音识别极速版

将60秒内的中文普通话音频快速识别为文字,实时返回识别结果,适用于手机语音搜索、聊天输入等场景。

接口

短语音识别极速版

规格
1000万次
有效期

12个月

购买数量
----
¥
立即购买

实时语音识别-中文普通话

将音频流实时识别为文字,并返回每句话的开始和结束时间。

接口
实时语音识别-中文普通话
规格
1万小时
有效期

12个月

购买数量
----
¥
立即购买

音频文件转写-中文普通话

将批量上传的音频文件识别为文字,12小时内返回识别结果,适合录音质检、会议内容总结等场景。

接口
音频文件转写-中文普通话
规格
1万小时
有效期

12个月

购买数量
----
¥
立即购买

短文本在线合成-基础音库

可将文本转换为音频,支持4种音库,为您提供高性价比的语音合成服务。

接口
短文本在线合成-基础音库
规格
1000万次
有效期

12个月

购买数量
----
¥
立即购买

长文本在线合成-基础音库

提供4种基础音库,将超长文本快速转换成稳定流畅、饱满真实的音频。

接口
长文本在线合成-基础音库
规格
1000万字符
有效期

12个月

购买数量
----
¥
立即购买

大模型声音复刻-创建音色

上传训练音频,通过大模型声音复刻创建音色。

接口
大模型声音复刻-创建音色
规格
200次
有效期

12个月

购买数量
----
¥
立即购买

呼叫中心实时语音识别(8K)

将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景。

接口

呼叫中心实时语音识别(8K)

规格
1万小时
有效期

12个月

购买数量
----
¥
立即购买

人脸离线识别SDK

设备端本地化人脸检测与采集、活体检测、人脸识别功能。

规格
100-499个
购买方式

单设备/批量授权

有效期

永久

----
¥
立即购买

在线图片活体V4

基于单张图片,判断图片中的人脸是否为二次翻拍。

接口

在线图片活体V4

规格
10万次
有效期

12个月

购买数量
----
¥
立即购买

人脸实名认证V4

连接权威数据源远程核验人脸图片+姓名+身份证号。

接口

人脸实名认证V4

规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

人脸对比V4

对比两张图片中的人脸,并返回相似度分值。

接口

人脸对比V4

规格
10万次
有效期

12个月

购买数量
----
¥
立即购买

身份证与名字比对

基于输入的姓名、身份证号,与权威数据源比对进行实名认证。

接口

身份证与名字比对

规格
5万次
有效期

12个月

购买数量
----
¥
立即购买

人脸库管理-人脸更新

构建一个人脸库,用于更新人脸库中,指定用户下的人脸信息。

接口
人脸库管理-人脸更新
规格
1000万次
有效期

12个月

购买数量
----
¥
立即购买

人脸搜索M:N

对一张图片中存在的 M 张人脸完成全部搜索并返回对应用户和相似度。

接口

人脸搜索M:N

规格
1000万次
有效期

12个月

购买数量
----
¥
立即购买

文本翻译-通用版

提供200+语种互译的在线文本翻译,支持术语定制功能。

接口

文本翻译-通用版

规格
5000万字符
有效期

12个月

购买数量
----
¥
立即购买

文本翻译-词典版

翻译结果附带百万量级中英词典资源、语音合成资源。

接口

文本翻译-词典版

规格
5000万字符
有效期

12个月

购买数量
----
¥
立即购买

文档翻译

支持Word、PDF等常见文档翻译,文档样式高度还原。

接口

文档翻译

规格
5000万字符
有效期

12个月

购买数量
----
¥
立即购买

图片翻译

结合OCR及机器翻译,对图片内文本进行翻译及译文实景回填。

接口

图片翻译

规格
10万次
有效期

12个月

购买数量
----
¥
立即购买

语音翻译

将60秒以内的语音识别成文字并翻译成目标语言。

接口

语音翻译

规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

实时语音翻译

支持中英日韩法西泰俄等45个语种,采用WebSocket协议,将音频流实时识别为文字。支持智能断句,实时输出带有标点的语音识别结果和翻译结果,适用于直播翻译、会议翻译、跨国交流等场景。

接口

实时语音翻译

规格
100小时
有效期

12个月

购买数量
----
¥
立即购买

在线咨询数字员工

适合小型团队协作,支持多人共享任务与数据。雇佣员工数不限,同时支持3位员工上岗。

规格
专业版
购买方式
按年
有效期
1年
----
¥
立即购买

一见视觉大模型 A1套餐

即开即用的专业级视觉AI应用,边缘设备统一管理,云端多模态大模型分析,人员安全、设备和环境异常等事件的查看处置。

设备
4路摄像头
大模型AI技能
5千次复判/分析
存储空间
100G
时长

1年

----
¥
立即购买

一见视觉大模型 P1套餐

提供低门槛视觉AI应用生产能力,实现个性化视觉AI需求快速满足,模型自主迭代调优。

模型训练
5000卡时计算资源
大模型AI技能
10万次复判/分析
存储空间
10TB
时长

1年

----
¥
立即购买

内容审核通用资源包

提升业务灵活性,可在内容审核下图像、文本、短视频和长视频审核多付费接口共用。

规格
1000万点
购买方式

按点数包

有效期

12个月

购买数量
----
¥
立即购买

图片内容分析

针对图片进行结构化分析,输出实体分析、人脸识别、LOGO识别、关键词提取等多个维度的标签。

接口

图片内容分析

规格
10万张
有效期

12个月

购买数量
----
¥
立即购买

视频内容分析

针对视频进行结构化分析,输出视频内容主题、场景、实体分类、人脸识别、LOGO识别、关键词等标签,同时可对视频进行语音、画面文字、字幕内容的识别。

接口

视频内容分析

规格
500小时
有效期

12个月

购买数量
----
¥
立即购买

智能封面

结合清晰度、人脸、构图、场景识别等特征信息,综合输出视频的封面,包括静态封面、GIF动态封面图、封面视频。

接口

智能封面

规格
500小时
有效期

12个月

购买数量
----
¥
立即购买

精彩视频分析

对视频的镜头、画面、声音进行分析,输出视频中的高光时刻时间戳信息。

接口

精彩视频分析

规格
50小时
有效期

12个月

购买数量
----
¥
立即购买

Sugar BI

零代码分钟级构建BI报表与可视化大屏。对话式实现查询、归因、洞察、预测、总结。

Saas版本

基础版

最大用户
1
有效期

1年

----
¥
立即购买

Sugar BI

零代码分钟级构建BI报表与可视化大屏。对话式实现查询、归因、洞察、预测、总结。

Saas版本

高级版

最大用户
10
有效期

1年

----
¥
立即购买

热销精选

大额千帆大模型,AI开放能力量包限时75折起,新老客同享!活动规则

  • 文字识别
  • 大模型增值服务
  • 文字识别离线SDK
  • 语音技术
  • 人脸识别
  • 机器翻译
  • 图像技术
  • 大模型
  • 内容创作

OCR共享资源包

支持OCR多产品跨接口使用(核验类接口、智能文档平台除外)。

接口

OCR共享资源包

规格
10万点
有效期

12个月

购买数量
----
¥
立即购买

文档解析

支持输出doc、pdf、xlsx等16种格式文档的版面、表格、阅读顺序等信息。

接口
文档解析
规格
100万页
有效期

12个月

购买数量
----
¥
立即购买

企业工商信息查询-标准版

通过营业执照关键字段,一键查询企业基础工商信息,包含法人、注册资本、信用代码等20+字段。

接口
企业工商信息查询-标准版
规格
100次
有效期

12个月

购买数量
----
¥
立即购买

道路运输证识别

结构化识别全国各地道路运输证,返回业户名称、地址、车辆号牌等14个关键字段信息。

接口
道路运输证识别
规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

文档抽取

支持OCR多产品跨接口使用(核验类接口、智能文档平台除外)。

接口
文档抽取
规格
1千页
有效期

12个月

购买数量
----
¥
立即购买

增值税发票验真

支持全部12类增值税发票信息核验,并返回票面全部字段信息,开票后24小时即可查验。

接口
增值税发票验真
规格
100次
有效期

12个月

购买数量
----
¥
立即购买

医疗发票识别

结构化识别全国各地门诊/住院发票的全字段信息。

接口
医疗发票识别
规格
1千次
有效期

12个月

购买数量
----
¥
立即购买

文档矫正增强

检测与矫正图片中文档、票据主体内容,支持图片效果增强。

接口
文档矫正增强
规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

工信部教考中心大模型证书

课程培训标准由工业和信息化部教育考试中心和百度联合发布,百度基于标准精心打造培训课程,岗位分为初、中、高三个级别,对生成式人工智能行业人才培养具有很强的指导性。

服务项
初级认证套餐
购买方式

按次

购买数量
----
¥
立即购买

百度职业技能认证

百度智能云发布了一套全面覆盖人工智能技术领域的岗位能力标准"课程+考试。

服务项
大模型智能客服运营工程师
购买方式

按次

购买数量
----
¥
立即购买

大模型智能客服运营工程师

面向智能客服领域的从业者,结合平台实操演示,深度讲解大模型技术原理与行业实战。"课程+考试。

服务项

大模型智能客服运营工程师

购买方式

按次

购买数量
----
¥
立即购买

通用文字识别离线SDK

可离线识别各类文本信息,支持中、英及中英混合,Windows版本全新上线,性能更强劲。

接口

通用文字识别离线SDK

购买方式

按设备授权

有效期

永久

----
¥
立即购买

车牌识别离线SDK

毫秒级响应识别车牌信息,集成在手机、执法记录仪等移动终端设备中。

接口

车牌识别离线SDK

购买方式

按设备授权

有效期

永久

----
¥
立即购买

身份证识别离线SDK

结构化识别二代居民身份证正反面所有8个字段。

接口

身份证识别离线SDK

购买方式

按设备授权

有效期

永久

----
¥
立即购买

数字字母识别离线SDK

识别图片中所有的数字和字母,快速提取编号信息。

接口

数字字母识别离线SDK

购买方式

按设备授权

有效期

永久

----
¥
立即购买

VIN码识别离线SDK

识别车辆挡风玻璃处的车架号码,集成于PDA、手持平板或手机APP中。

接口

VIN码识别离线SDK

购买方式

按设备授权

有效期

永久

----
¥
立即购买

办公文档识别离线SDK

支持版式识别、手写识别能力,将图片/PDF转换为Word文档。

接口

办公文档识别离线SDK

购买方式

按设备授权

有效期

永久

----
¥
立即购买

行驶证识别离线SDK

对机动车行驶证主页及副页22个字段进行结构化识别。

接口

行驶证识别离线SDK

购买方式

按设备授权

有效期

永久

----
¥
立即购买

大模型声音复刻-创建音色

上传训练音频,通过大模型声音复刻创建音色。

接口
大模型声音复刻-创建音色
规格
50次
有效期

12个月

购买数量
----
¥
立即购买

短语音识别标准版-中文普通话

将60秒内的中文普通话音频识别为文字,适用于语音对话、语音控制、语音输入等场景。

接口
短语音识别标准版-中文普通话
规格
100万次
有效期

12个月

购买数量
----
¥
立即购买

短语音识别极速版

将60秒内的中文普通话音频快速识别为文字,实时返回识别结果,适用于手机语音搜索、聊天输入等场景。

接口

短语音识别极速版

规格
100万次
有效期

12个月

购买数量
----
¥
立即购买

实时语音识别-中文普通话

将音频流实时识别为文字,并返回每句话的开始和结束时间。

接口
实时语音识别-中文普通话
规格
1000小时
有效期

12个月

购买数量
----
¥
立即购买

音频文件转写-中文普通话

将批量上传的音频文件识别为文字,12小时内返回识别结果,适合录音质检、会议内容总结等场景。

接口
音频文件转写-中文普通话
规格
1000小时
有效期

12个月

购买数量
----
¥
立即购买

音频文件转写-音视频字幕(中文)

助力内容生产平台高效生成字幕,极速转写,无需排队,精准匹配。

接口

音频文件转写-音视频字幕(中文)

规格
1000小时
有效期

12个月

购买数量
----
¥
立即购买

短文本在线合成-基础音库

可将文本转换为音频,支持4种音库,为您提供高性价比的语音合成服务。

接口
短文本在线合成-基础音库
规格
100万次
有效期

12个月

购买数量
----
¥
立即购买

长文本在线合成-基础音库

提供4种基础音库,将超长文本快速转换成稳定流畅、饱满真实的音频。

接口
长文本在线合成-基础音库
规格
100万字符
有效期

12个月

购买数量
----
¥
立即购买

呼叫中心实时语音识别(8K)

将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景。

接口

呼叫中心实时语音识别(8K)

规格
1000小时
有效期

12个月

购买数量
----
¥
立即购买

呼叫中心语音-音频文件转写(8K)

大批量识别8k采样率电话录音文件,适用于电话内容分析、质检场景。

接口

呼叫中心语音-音频文件转写(8K)

规格
1000小时
有效期

12个月

购买数量
----
¥
立即购买

呼叫中心语音-在线合成-客服音库

提供客服场景专属音色,为机器人的应答内容提供情感丰富、高度拟人、流畅自然的语音合成与播报功能。

接口

呼叫中心语音-在线合成-客服音库

规格
100万次
有效期

12个月

购买数量
----
¥
立即购买

人脸离线识别SDK

设备端本地化人脸检测与采集、活体检测、人脸识别功能。

规格
100-499个
购买方式

单设备/批量授权

有效期

永久

----
¥
立即购买

在线图片活体V4

基于单张图片,判断图片中的人脸是否为二次翻拍。

规格
1万次
购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

人脸实名认证V4

连接权威数据源远程核验人脸图片+姓名+身份证号。

规格
1000次
购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

人脸对比V4

对比两张图片中的人脸,并返回相似度分值。

规格
1万次
购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

身份证与名字比对

基于输入的姓名、身份证号,与权威数据源比对进行实名认证。

规格
1000次
购买方式

按次数包

有效期

12个月

购买数量
----
¥
立即购买

人脸对比V3

支持生活照、证件照、身份证芯片照、带网纹照、红外黑白照的人脸对比。

接口
人脸对比V3
规格
100万次
有效期

12个月

购买数量
----
¥
立即购买

人脸库管理-人脸更新

构建一个人脸库,用于更新人脸库中,指定用户下的人脸信息。

接口
人脸库管理-人脸更新
规格
100万次
有效期

12个月

购买数量
----
¥
立即购买

人脸关键点检测

对图片中的人脸进行关键点定位,并返回常用的人脸关键点坐标位置。

接口
人脸关键点检测
规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

文本翻译-通用版

提供200+语种互译的在线文本翻译,支持术语定制功能。

接口

文本翻译-通用版

规格
1000万字符
有效期

12个月

购买数量
----
¥
立即购买

文本翻译-词典版

翻译结果附带百万量级中英词典资源、语音合成资源。

接口

文本翻译-词典版

规格
1000万字符
有效期

12个月

购买数量
----
¥
立即购买

文档翻译

支持Word、PDF等常见文档翻译,文档样式高度还原。

接口

文档翻译

规格
1000万字符
有效期

12个月

购买数量
----
¥
立即购买

图片翻译

结合OCR及机器翻译,对图片内文本进行翻译及译文实景回填。

接口

图片翻译

规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

语音翻译

将60秒以内的语音识别成文字并翻译成目标语言。

接口

语音翻译

规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

实时语音翻译

支持中英日韩法西泰俄等45个语种,采用WebSocket协议,将音频流实时识别为文字。支持智能断句,实时输出带有标点的语音识别结果和翻译结果,适用于直播翻译、会议翻译、跨国交流等场景。

接口

实时语音翻译

规格
100小时
有效期

12个月

购买数量
----
¥
立即购买

相同图片搜索-检索

在自建图库中找到与检索图相同的图片。

接口
相同图片搜索-检索
规格
10万次
有效期

12个月

购买数量
----
¥
立即购买

相似图片搜索-检索

在自建图库中找到与检索图片语义相似的图片集,并给出相似度打分。

接口
相似图片搜索-检索
规格
10万次
有效期

12个月

购买数量
----
¥
立即购买

商品图片搜索-检索

针对商品类图片,专项训练检索模型,在自建图库中搜索相同及相似的商品图片集。

接口
商品图片搜索-检索
规格
10万次
有效期

12个月

购买数量
----
¥
立即购买

绘本图片搜索-检索

针对拍照搜童书场景专项优化算法,支持用局部绘本页面图片。

接口
绘本图片搜索-检索
规格
10万次
有效期

12个月

购买数量
----
¥
立即购买

面料图搜索-检索

在自建图库中找到与检索图片花纹相似的图片集,并给出相似度打分。

接口
面料图搜索-检索
规格
10万次
购买方式

按次数包

有效期

12个月

----
¥
立即购买

通用物体和场景识别

识别10万类物体和场景,返回大类及细分名称、百科信息。

接口
通用物体和场景识别
规格
10万次
有效期

12个月

购买数量
----
¥
立即购买

黑白图片上色

智能识别黑白图像内容并填充色彩,使黑白图像变得鲜活。

接口
黑白图片上色
规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

图像对比度增强

智能调整过暗或过亮图像的对比度,使图像更加鲜明。

接口
图像对比度增强
规格
1万次
有效期

12个月

购买数量
----
¥
立即购买

千帆大模型 Tokens量包

单条数据支持8k tokens。2025年3月24日最新版本,由杭州深度求索人工智能基础技术研究有限公司自研的 MoE 模型,在百科知识、数学推理等多项任务上优势突出,评测成绩在主流榜单中位列开源模型榜首。

接口

DeepSeek-V3

规格
1亿
购买方式

按Tokens包

有效期

3个月

----
¥
立即购买

千帆大模型 Tokens量包

单条数据支持8k tokens。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

接口

DeepSeek-R1

规格
1亿
购买方式

按Tokens包

有效期

3个月

----
¥
立即购买

千帆大模型 Tokens量包

性能全面升级,增强逻辑推理与抗幻觉能力,代码处理更高效,响应速度更快且成本更低。

接口

ERNIE-4.5-Turbo-32K

规格
1亿
购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

千帆大模型 Tokens量包

128K超长上下文支持,优化多轮对话记忆与长文本处理,综合能力全面提升,满足深度交互需求。

接口

ERNIE-4.5-Turbo-128K

规格
1亿
购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

千帆大模型 Tokens量包

多模态能力突破,图像理解与跨模态创作显著提升,支持32K上下文并优化响应速度。

接口

ERNIE-4.5-Turbo-VL-32K

规格
1亿
购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

千帆大模型 Tokens量包

深度思考引擎升级,强化思维链与多模态协同,问答创作及复杂推理能力跨越式提升。

接口

ERNIE-X1-Turbo-32K

规格
1亿
购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

千帆大模型 Tokens量包

百度自研高性能大语言模型,上下文支持128K,通用能力优异,具备极佳的推理性能,适合作为基座模型进行精调,处理特定场景问题。

接口

ERNIE-Speed-Pro-128K

规格
1亿
购买方式

按Tokens包

有效期

12个月

----
¥
立即购买

千帆大模型 Tokens量包

百度自研的轻量级大语言模型,上下文支持128K,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。

接口

ERNIE-Lite-Pro-128K

规格
1亿
购买方式

按Tokens包

有效期

12个月

----
¥
立即购买

搜索增强包

基于联网搜索能力,模型能获取天气、新闻等实时数据和信息,更精确回答用户的特定问题。

接口

搜索增强包

规格
1万
购买方式

按Tokens包

有效期

6个月

----
¥
立即购买

内容审核通用资源包

提升业务灵活性,可在内容审核下图像、文本、短视频和长视频审核多付费接口共用。

规格
10万点
购买方式

按点数包

有效期

12个月

购买数量
----
¥
立即购买

短音频同步审核

语音识别结合声纹检测及文本审核能力,支持短音频实时检测。

规格
20万次
购买方式

按次数包

有效期

12个月

购买数量

----
¥
立即购买

音频文件异步审核

语音识别结合声纹检测及文本审核能力,支持音频流异步检测。

规格
10万小时
购买方式

按小时包

有效期

12个月

购买数量
----
¥
立即购买

图片内容分析

针对图片进行结构化分析,输出实体分析、人脸识别、LOGO识别、关键词提取等多个维度的标签。

规格
10万张
购买方式

按张数包

有效期

12个月

购买数量

----
¥
立即购买

智能封面

结合清晰度、人脸、构图、场景识别等特征信息,综合输出视频的封面,包括静态封面、GIF动态封面图、封面视频。

接口
智能封面
规格
500小时
有效期

12个月

购买数量
----
¥
立即购买

AI作画PaaS-基础版

将创意一键变成创作 ,生成不限定风格的图像,AI一下文字成画。

接口
AI作画PaaS-基础版
规格
600点
有效期

12个月

购买数量
----
¥
立即购买

AI成片PaaS

输入图文素材,一键生成短视频,自动实现配音、添加数字人等环节。

规格
4000点
购买方式

按点数包

有效期

12个月

购买数量
----
¥
立即购买

主体一致图像生成与调整

通过Prompt精准控制AI作画中角色形象的一致性,支持灵活调整风格与场景。适用于绘本、插画及人像创作,助力连贯叙事与多样化表达,提升创作的连贯性与艺术表现力。

接口
主体一致图像生成与调整
规格
2000点
有效期

12个月

购买数量
----
¥
立即购买

多场景组合,普惠好价

超值优品一键购齐,助力企业和开发者加速成长活动规则

大模型培训

权威证书:参加培训并考试合格可获得百度证书和工信教考中心颁发的职业技术证书,一考双证 精选课程:面向使用大模型进行智能创作的人员,提供理论和应用实践相结合的课程体系

千帆大模型平台
ERNIE/4.0/8K/1000万/按Tokens包/6个月
大模型培训服务
工信部教考中心大模型证书/初级认证套餐/按次
----
¥
组合购买

内容审核

利用大模型进行话题和新闻事件生成,在大模型内置审核基础上可增加对生成内容的二次审核 支持自定义配置审核策略,满足不同应用场景,避免违规内容曝光在公众平台

千帆大模型平台
ERNIE/4.0/8K/1000万/按Tokens包/6个月
内容审核
内容审核通用资源包/1万点/按点数包/12个月
----
¥
组合购买

千帆调用

高性能云服务器与千帆大模型组合,适用于企业调用千帆场景 千帆产品必选,任意搭配1款产品组合购买,新老同享组合优惠

大模型资源包
ERNIE/4.0/8K/1000万/按Tokens包/6个月
云服务器
云服务器经济型 e1/2核2G/40G/1M/1年
BOS对象存储
标准存储包/1TB/1年/数据频繁读取
----
¥
组合购买

智能阅卷

对试卷、作文、答题卡等进行拍照扫描,结构化识别作业内容、题干选项答案、学生考号、姓名等信息 通过大模型进行判断和批改,辅助教师提升阅卷效率

大模型资源包
ERNIE/4.0/8K/1000万/按Tokens包/6个月
OCR
OCR共享资源包/10万点/按点数包/12个月
----
¥
组合购买

拍照搜题

对考试、作业等进行拍照扫描,结构化识别题干及选项等信息 通过大模型理解和推理,快速搜索相似题目

大模型资源包
ERNIE/4.0/8K/1000万/按Tokens包/6个月
OCR
OCR共享资源包/10万点/按点数包/12个月
----
¥
组合购买

文档知识库

办公文档数字化处理,高效提取文字及其位置信息 通过大模型进行分类,方便后续编辑、检索、分析等操作

大模型资源包
ERNIE/4.0/8K/1000万/按Tokens包/6个月
OCR
OCR共享资源包/10万点/按点数包/12个月
----
¥
组合购买

智能语音助手

运用语音合成技术实现智能语音讲解,方便学生利用碎片化时间学习 同时,智能语音交互学习助手帮助解答学生在学习过程中遇到的问题

大模型资源包
ERNIE/4.0/8K/1000万/按Tokens包/6个月
SPEECH
实时语音识别/中文普通话/1000小时/按小时包/12个月
----
¥
组合购买

游戏场景

网络游戏注册账号时需远程身份核验,语音合成为NPC配音提升互动趣味性,基础云护航游戏体验。

FACE
人脸实名认证V4/1000次/按次数包/12个月
SPEECH
短文本在线合成/基础音库/100万次/按次数包/12个月
云服务器经济型
云服务器经济型 e1/2核4G/40G/1M/1年
BOS对象存储
标准存储包/500GB/1年/数据频繁读取
----
¥
组合购买

电子商务

OCR助力商户信息登记,基础云支撑电商平台高效运转。

OCR
OCR共享资源包/10万点/按点数包/12个月
云服务器经济型
云服务器经济型 e1/2核4G/40G/1M/1年
BOS对象存储
标准存储包/500GB/1年/数据频繁读取
----
¥
组合购买

在线教育

OCR精准识别题目及答案,提升教学及阅卷效率,基础云赋能保障流畅体验。

OCR
OCR共享资源包/10万点/按点数包/12个月
云服务器经济型
云服务器经济型 e1/2核4G/40G/1M/1年
BOS对象存储
标准存储包/500GB/1年/数据频繁读取
----
¥
组合购买

金融保险

OCR快审证件、加速单据处理,基础云为金融保险业务稳健赋能。

OCR
iOCR通用版/1万次/按次数包/12个月
云服务器经济型
云服务器经济型 e1/2核4G/40G/1M/1年
BOS对象存储
标准存储包/500GB/1年/数据频繁读取
----
¥
组合购买
人工智能
季度热销榜

更多会场 更多优惠

更多超值优惠活动直达 限量抢购!

新客专享特价会场
云服务器首年低至0.6折
立即前往
千帆大模型平台特惠
DeepSeek在线课程9.1折
立即前往
场景组合购会场
多件同享折上优惠2.8折起
立即前往
云计算上云必备会场
高性能服务器3.2折,上云产品一站购齐
立即前往
企业服务分会场
通用文字识别首购1元起
立即前往
AI大模型线上学习充电站
7款大奖等你拿
立即前往