数据与安全服务工作说明书
1. 服务概述
数据转换服务是给有数据转换需求的客户提供的定制化人工服务。例如财会人员对票据做电子归档,员工将会议音频整理成文字,音视频制作人员将台词合成为音频等。服务内容包含数据转换(图片转文字、音频转文字、文字转音频等),让客户无需购买AI开放能力,零代码完成数据大批量的转换。
2. 服务范围
数据智能转换服务范围包含
- 图片转文字
- 音频转文字
- 文字转音频
- 转换后的数据格式化处理(文本拼接、音频拼接等)
数据智能转换服务范围不包含:
- 代码、算法、模型及软件的开发
- 识别效果调优
3. 前提条件
- 该数据转换服务仅面向百度智能云客户,客户在百度智能云购买服务后获取服务支持
- 客户在购买此服务前,需要自行验证识别效果是否符合自己的预期。符合自己的预期后,再购买服务,避免不必要的纠纷。文字识别效果测试页面参考这里;语音合成效果测试页面参考这里。
- 客户在百度智能云购买服务后,提供需要转换的数据文件下载链接,说明转换要求。数据存储建议使用百度智能云的对象存储,会有一点存储和流量的费用,产品官网参考这里。
-
数据文件格式和存储要求说明:
- 图片转文字:jpg/jpeg/png/bmp格式的图片,图片尺寸最小边大于15px;未加密的PDF文件,单个文件大小不超过10M;同类型的图片数据(例如都是增值税发票的图片)放在同一个目录下(建议目录名称为图片内容类型,例如增值税发票),将这些目录打包压缩成zip格式,存储至云端的对象存储中。
- 音频转文字:pcm/wav/amr/m4a格式的音频,采样率大于等于16000,16bit位深,单个文件大小不超过1500M;同类型的音频文件(例如都是中文普通话的音频)放在同一个目录下(建议名称为音频语种,例如中文普通话或者英文),将这些目录打包压缩成zip格式,存储至云端的对象存储中。
4. 服务内容
数据预处理服务
不符合格式要求的文件,可提供格式转换服务,经过格式转换的数据,识别效果可能受一定影响。 格式转换包含图片存储格式转换,图片大小压缩,图片尺寸压缩;音频采样率压缩,双声道转单声道,长音频分割成多个短音频。
图片转文字服务
基于百度智能云对外提供的OCR API接口,将图片数据转换成文本,包含通用文字识别,身份证识别,银行卡识别等,详细识别能力列表以官网API文档中的接口能力列表为准,识别效果以接口返回的实际结果为准,存在一定的识别不准的情况,不保证100%识别准确。识别结果可按照客户要求,以Excel、txt、doc、pdf等格式提供。
音频转文字服务
基于百度智能云对外提供的语音识别API接口,将音频数据转换成文本。识别效果以接口返回的实际结果为准,存在一定的识别不准的情况,不保证100%识别准确。如果客户提供的音频不满足接口要求,可处理成符合接口要求的格式,音频转换存在一定精度损失,可能影响最终识别效果。识别结果可按照客户要求,以Excel、txt、doc、pdf等格式提供。
文字转音频服务
基于百度智能云对外提供的语音合成API接口,将文本转换成音频。合成音频效果以接口返回的实际结果为准。合成的音频可按照客户要求,以mp3、wav等格式提供。可将合成的音频拼接成一个或多个音频文件。
数据交付周期
根据客户提供的数据量,和定制化需求,交付周期以实际沟通结果为准。 交付周期参考:一万张图片转文字一个工作日内完成,10小时以内的音频转文字一个工作日内完成,10万字/一万个短文本(60字内)合成音频一个工作日内完成
数据交付方式
数据以百度智能云对象存储链接方式提供,客户可通过浏览器下载转换后的数据。
数据存储周期
数据自交付之日起,在云端存储30天,客户需在30天之内完成下载,超出30天数据将自动删除。
转换数据结果说明
转换后的数据结果全部是AI模型处理后得出的,人工仅对模型输出的结果进行格式处理,并不会对识别结果的准确性进行干预。
数据安全
详见百度数据安全协议。百度工作人员不会私自存储和传播客户数据。
5. 服务SLA
接收到客户需求时,百度智能云售后工程师将于一个工作日内和客户取得联系,支持工作日5x8电话/工单沟通需求细节。数据交付周期以双方沟通约定为准。
6. 服务流程
服务环节 | 服务事项 | 交付物 |
---|---|---|
客户购买数据转换服务 | N/A | N/A |
工程师和客户沟通数据转换需求 | 工程师和客户针对数据转换需求进行沟通,明确数据转换所需要使用的AI能力,以及数据转换后的数据存储格式。针对数据转换后的准确性,工程师将指导客户去AI开放平台上的示例页面进行体验,如所需使用的AI能力无测试页面,则工程师会提供手动转换后的示例数据供客户参考。 | 《数据转换服务说明书》 |
客户提供正式数据下载链接 | 客户根据《数据转换服务说明书》,将数据上传至百度智能云对象存储或者其他云厂商的对象存储,将数据下载链接提交至控制台页面 | - |
工程师对正式数据进行处理 | 工程师从百度智能云对象存储下载正式数据,调用对应AI接口进行数据转换,按照《数据转换服务说明书》将转换后的数据做格式处理并上传至百度智能云对象存储,并且设置数据自动删除时间为30天。 | 转换后的正式数据下载链接(含鉴权信息) |
7. 客户责任
客户需按照要求提供可公网访问的数据下载链接。数据需要符合《数据转换服务说明书》中的格式和存储目录结构要求。
8. 完成标志
全部数据完成转换并交付后,视为服务完成。转换后的数据在云端存储30天。30天后数据自动删除。