原子能力API(调试版)
多模态云播放有声资源
接口描述
- 接口概述
本接口为开发者提供多模态有声资源检索与云播放能力。调用者输入文本或语音指令从资源库检索出:流行音乐、儿童音乐、儿童故事、相声戏曲等数十万首音频资源, 经由云端解码、转码,输出统一格式,通过 HTTP SSE (Server-Sent Events) 协议下发 Base64 编码的音频帧和文本帧。有声资源库动态更新,请注意内容变化。
- 交互流程
用户可以通过自然语言(语音或文字)下发指令,例如:
“播放邓紫棋的 泡沫”
“播放一千零一夜的故事”
“播放音乐”
- 播放模式详解
服务端将音频切片并转换为 PCM16 采样格式,经 Base64 编码后通过 SSE 通道推送。技术要求:
1* 解码:客户端需实时接收 SSE 消息并进行 Base64 解码以还原 PCM 原始数据。
2* 平滑播放:为避免网络抖动导致卡顿,强烈建议在本地建立一个缓冲区,在预存一定数量的音频帧后再驱动声卡进行播放。
3* 参数参考:音频格式为单声道 PCM16,采样率请参照具体响应头参数。
- 权限说明
当前版本为调试版本,相关api可以直接调用。待后续更新为正式版本后,需要安装sdk后通过license激活使用。
请求结构
1POST /sse/v{version}/aiagent/chat/completions/content/get HTTP/1.1
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "messages": [
6 {
7 "contentItems": [
8 {
9 "type":"text",
10 "text":"播放音乐"
11 },
12 {
13 "type":"audio",
14 "audio":{
15 "data":"base64xxxx"
16 }
17 }
18 ]
19 }
20 ],
21 "response_format": {
22 "text_stream": true,
23 "enable_tts": true,
24 "resource_type": "audio"
25 }
26 }
请求头域
除公共头域外,无其它特殊头域。(后续正式版需要携带 authorization )
请求参数
| 参数名称 | 类型 | 是否必选 | 参数位置 | 描述 |
|---|---|---|---|---|
| messages | List<Object> | 是 | RequestBody | 用户query列表。多种类型同时存在时,以text为准;同一类型多个值时,仅第一个值生效 |
| + type | String | 是 | RequestBody | qurey类型 |
| + text | String | type=text时,必选 | RequestBody | 文本型query内容 |
| + audio | Object | type=audio时,必选 | RequestBody | 语音型query内容的对象 |
| ++ data | String | type=audio时,必选 | RequestBody | base64编码的语音query字符串 |
| response_format | Object | 是 | RequestBody | 指定的返回内容信息 |
| + text_stream | Boolean | 否 | RequestBody | 文本流式返回,默认值为true |
| + resource_type | String | 是 | RequestBody | 音乐返回类型,取值为audio |
响应头域
除公共头域外,无其它特殊头域。
响应参数
SSE格式返回,具体类型如下:
"type":"system.connect" -> 系统消息:连接成功
"type":"system.processing" -> 系统消息:请求处理中
"type":"transcript.median" -> query中间值
"type":"transcript" -> query完整值
"type":"answer.median" -> 回复内容中间值
"type":"answer" -> 回复内容完整值
"type":"audio.header" -> 音频格式信息
"type":"audio.content" -> base64的音频帧
[DONE] -> 结束标识
请求示例
1POST https://gwgp-tdvpwojkegj.i.bdcloudapi.com/sse/v1/aiagent/chat/completions/content/get
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "messages": [
6 {
7 "contentItems": [
8 {
9 "type":"text",
10 "text":"播放音乐"
11 },
12 {
13 "type":"audio",
14 "text":"base64xxxx"
15 }
16 ]
17 }
18 ],
19 "response_format": {
20 "text_stream": true,
21 "enable_tts": true,
22 "resource_type": "audio"
23 }
24}
响应示例
1data:{"type":"system.connect","desc":"SSE流连接已建立"}
2data:{"type":"system.processing","desc":"正在处理您的请求"}
3data:{"type":"transcript.median","desc":"query中间值","data":{"text":"帮"}}
4data:{"type":"transcript.median","desc":"query中间值","data":{"text":"帮我"}}
5data:{"type":"transcript.median","desc":"query中间值","data":{"text":"帮我播放一首"}}
6data:{"type":"transcript.median","desc":"query中间值","data":{"text":"帮我播放一首音乐"}}
7data:{"type":"transcript","desc":"query完整值","data":{"text":"帮我播放一首音乐。"}}
8data:{"type":"answer.median","desc":"回复中间值","data":{"text":"我找找..."}}
9data:{"type":"audio.header","desc":"音频格式","data":{"channel":1,"format":"pcm16","sample_rate":16000}}
10data:{"type":"answer","desc":"回复完整值","data":{"text":"我找找...一首邓宝的喜欢你送给你"}}
11data:{"type":"audio.content","desc":"音频","data":{"base64Audio":"base64xxxxxx"}}
12data:[DONE]
多模态互联网信息检索
接口描述
- 接口概述
本接口为开发者提供多模态互联网信息检索能力。支持采用文本或语音指令,从互联网中实时检索出相关内容,经由大模型总结提炼,通过 HTTP SSE (Server-Sent Events) 协议下发 Base64 编码的音频帧和文本帧。例如
- 交互流程
用户可以通过自然语言(语音或文字)下发指令,例如:
“今天天气怎么样”
“特朗普什么时候当选总统”
- 权限说明
当前版本为调试版本,相关api可以直接调用。待后续更新为正式版本后,需要安装sdk后通过license激活使用。
请求结构
1POST /sse/v{version}/aiagent/chat/completions/search HTTP/1.1
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "messages": [
6 {
7 "contentItems": [
8 {
9 "type":"text",
10 "text":"明天天气怎样"
11 },
12 {
13 "type":"audio",
14 "audio":{
15 "data":"base64xxxx"
16 }
17 }
18 ]
19 }
20 ],
21 "response_format": {
22 "text_stream": true,
23 "enable_tts": true
24 }
25 }
请求头域
除公共头域外,无其它特殊头域。(后续正式版需要携带 authorization )
请求参数
| 参数名称 | 类型 | 是否必选 | 参数位置 | 描述 |
|---|---|---|---|---|
| messages | List<Object> | 是 | RequestBody | 用户query列表。多种类型同时存在时,以text为准;同一类型多个值时,仅第一个值生效 |
| + type | String | 是 | RequestBody | qurey类型 |
| + text | String | type=text时,必选 | RequestBody | 文本型query内容 |
| + audio | Object | type=audio时,必选 | RequestBody | 语音型query内容的对象 |
| ++ data | String | type=audio时,必选 | RequestBody | base64编码的语音query字符串 |
| response_format | Object | 否 | RequestBody | 指定的返回内容信息 |
| + text_stream | Boolean | 否 | RequestBody | 文本流式返回,默认值为true |
| + enable_tts | Boolean | 否 | RequestBody | 语音播报查询结果 |
响应头域
除公共头域外,无其它特殊头域。
响应参数
SSE格式返回,具体类型如下:
"type":"system.connect" -> 系统消息:连接成功
"type":"system.processing" -> 系统消息:请求处理中
"type":"transcript.median" -> query中间值
"type":"transcript" -> query完整值
"type":"answer.median" -> 回复内容中间值
"type":"answer" -> 回复内容完整值
"type":"audio.header" -> 音频格式信息
"type":"audio.content" -> base64的音频帧
[DONE] -> 结束标识
请求示例
1POST https://gwgp-tdvpwojkegj.i.bdcloudapi.com/sse/v1/aiagent/chat/completions/search
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "messages": [
6 {
7 "contentItems": [
8 {
9 "type":"text",
10 "text":"明天天气怎样"
11 },
12 {
13 "type":"audio",
14 "text":"base64xxxx"
15 }
16 ]
17 }
18 ],
19 "response_format": {
20 "text_stream": true,
21 "enable_tts": true
22 }
23}
响应示例
1data:{"type":"system.connect","desc":"SSE流连接已建立"}
2data:{"type":"system.processing","desc":"正在处理您的请求"}
3data:{"type":"transcript","desc":"query完整值","data":{"text":"明天天气怎么样"}}
4data:{"type":"answer.median","desc":"回复中间值","data":{"text":"明天天气晴转"}}
5data:{"type":"answer.median","desc":"回复中间值","data":{"text":"多云,气温20度"}}
6data:{"type":"answer","desc":"回复完整值","data":{"text":"明天天气晴转多云,气温20度"}}
7data:{"type":"audio.header","desc":"音频格式","data":{"channel":1,"format":"pcm16","sample_rate":16000}}
8data:{"type":"audio.content","desc":"音频","data":{"base64Audio":"base64xxxxxx"}}
9data:[DONE]
多模态云定时闹钟
接口描述
- 接口概述
本接口为开发者提供云闹钟能力。提供对云闹钟进行增删改查操作、定时触发后接口回调,接口调用结果支持语音播报(base64编码的音频帧)、文本输出。
- 交互流程
用户可以通过自然语言(语音或文字)下发指令,例如:
| 类别 | query示例 | 播报示例 |
|---|---|---|
| 任务新增 | 30分钟后提醒我喝水。 | 已为您添加2025年12月15日 19:57喝水的闹钟 |
| 定一个明天七点叫我起床的闹钟。 | 已为您添加2025年12月16日 07:00起床的闹钟 | |
| 每周一到五早上九点喊我吃饭。 | 已为您添加每周一至周五 09:00吃饭的闹钟 | |
| 每周工作日早上8点提醒我起床。 | 已为您添加每周一至周五 08:00起床的闹钟 | |
| 每周六晚上8点叫我运动。 | 已为您添加每周六 20:00运动的闹钟 | |
| 晚上8点我朋友叫我吃饭,到时候你记得提醒我。 | 已为您添加2025年12月15日 20:00吃饭的闹钟 | |
| 任务查询 | 我现在有哪些闹钟。 | 为您查询到6个符合条件的闹钟:每周一至周五 08:00 起床; 每周六 20:00 运动; 2025年12月15日 20:00 吃饭; 2025年12月15日 19:57 喝水; 2025年12月16日 07:00 起床; 每周一至周五 09:00 吃饭 |
| 今天我有什么计划。 | 为您查询到2个符合条件的闹钟:2025年12月15日 20:00 吃饭; 2025年12月15日 19:57 喝水 | |
| 我今天有什么要做的事吗。 | 为您查询到2个符合条件的闹钟:2025年12月15日 20:00 吃饭; 2025年12月15日 19:57 喝水 | |
| 我现在有哪些提醒? | 为您查询到6个符合条件的闹钟:每周一至周五 08:00 起床; 每周六 20:00 运动; 2025年12月15日 20:00 吃饭; 2025年12月15日 19:57 喝水; 2025年12月16日 07:00 起床; 每周一至周五 09:00 吃饭 | |
| 任务修改 | 把今天晚上8点吃饭的闹钟改到9点。 | 为您更新1个符合条件的闹钟,更新后的闹钟为:2025年12月15日 21:00 吃饭 |
| 把工作日9点吃饭的闹钟改到8点。 | 为您更新1个符合条件的闹钟,更新后的闹钟为:每周一至周五 08:00 吃饭 | |
| 刚刚有人请我吃过饭了,8点的闹钟我要改成去夜跑。 | 为您更新1个符合条件的闹钟,更新后的闹钟为:2025年12月15日 20:00 去夜跑 | |
| 明天早上计划有变,帮我把时间改到下午1点。 | 为您更新3个符合条件的闹钟,更新后的闹钟为:每周一至周五 13:00 吃饭; 2025年12月16日 13:00 起床; 每周一至周五 13:00 起床 | |
| 任务删除 | 把明天早上的起床闹钟删掉。 | 没有找到符合条件的闹钟,无法进行删除操作,您可以换种方式描述下想删除的闹钟 |
| 把今晚的闹钟删掉。 | 为您删除2个符合条件的闹钟:2025年12月15日 21:00 吃饭; 2025年12月15日 19:57 喝水 | |
| 把所有闹钟删掉。 | 为您删除4个符合条件的闹钟:每周一至周五 13:00 吃饭; 每周六 20:00 去夜跑; 2025年12月16日 13:00 起床; 每周一至周五 13:00 起床 |
- 权限说明
当前版本为调试版本,相关api可以直接调用。待后续更新为正式版本后,需要安装sdk后通过license激活使用。
请求结构
1POST /sse/v{version}/aiagent/chat/completions/timer/control HTTP/1.1
2Host:gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "messages": [
6 {
7 "contentItems": [
8 {
9 "type":"text",
10 "text":"5分钟后提醒我喝水"
11 },
12 {
13 "type":"audio",
14 "audio":{
15 "data":"base64xxxx"
16 }
17 }
18 ]
19 }
20 ],
21 "response_format": {
22 "text_stream": true,
23 "enable_tts": true,
24 "call_back_url":"http://127.0.0.1/v1/timer"
25 }
26 }
请求头域
除公共头域外,无其它特殊头域。(后续正式版需要携带 authorization )
请求参数
| 参数名称 | 类型 | 是否必选 | 参数位置 | 描述 |
|---|---|---|---|---|
| messages | List<Object> | 是 | RequestBody | 用户query列表。多种类型同时存在时,以text为准;同一类型多个值时,仅第一个值生效 |
| + type | String | 是 | RequestBody | qurey类型 |
| + text | String | type=text时,必选 | RequestBody | 文本型query内容 |
| + audio | Object | type=audio时,必选 | RequestBody | 语音型query内容的对象 |
| ++ data | String | type=audio时,必选 | RequestBody | base64编码的语音query字符串 |
| response_format | Object | 是 | RequestBody | 指定的返回内容信息 |
| + text_stream | Boolean | 否 | RequestBody | 文本流式返回,默认值为true |
| + enable_tts | Boolean | 否 | RequestBody | 语音播报查询结果 |
| + call_back_url | String | 是 | RequestBody | 闹铃回调地址 |
响应头域
除公共头域外,无其它特殊头域。
响应参数
SSE格式返回,具体类型如下:
"type":"system.connect" -> 系统消息:连接成功
"type":"system.processing" -> 系统消息:请求处理中
"type":"transcript.median" -> query中间值
"type":"transcript" -> query完整值
"type":"answer.median" -> 回复内容中间值
"type":"answer" -> 回复内容完整值
"type":"audio.header" -> 音频格式信息
"type":"audio.content" -> base64的音频帧
[DONE] -> 结束标识
请求示例
1POST https://gwgp-tdvpwojkegj.i.bdcloudapi.com/sse/v1/aiagent/chat/completions/timer/control
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "messages": [
6 {
7 "contentItems": [
8 {
9 "type":"text",
10 "text":"5分钟后提醒我喝水"
11 },
12 {
13 "type":"audio",
14 "text":"base64xxxx"
15 }
16 ]
17 }
18 ],
19 "response_format": {
20 "text_stream": true,
21 "enable_tts": false
22 }
23}
响应示例
1data:{"type":"system.connect","desc":"SSE流连接已建立"}
2data:{"type":"system.processing","desc":"正在处理您的请求"}
3data:{"type":"transcript","desc":"query完整值","data":{"text":"5分钟后提醒我喝水"}}
4data:{"type":"answer","desc":"回复完整值","data":{"text":"已为您添加2026年2月10日 15点05的喝水提醒"}}
5data:{"type":"audio.header","desc":"音频格式","data":{"channel":1,"format":"pcm16","sample_rate":16000}}
6data:{"type":"audio.content","desc":"音频","data":{"base64Audio":"base64xxxxxx"}}
7data:[DONE]
创建会议纪要任务
接口描述
- 接口概述
本接口为开发者提供会议音频的AI智能纪要能力。调用者输入会议音频URL,服务端自动进行ASR转写和LLM纪要生成,输出结构化的会议纪要内容。支持多种纪要模块,包括:会议基本信息、全文总结、分段总结、关键观点、待办事项等。
- 交互流程
用户提交音频URL创建异步任务,服务端返回任务ID用于后续查询。
- 权限说明
当前版本为调试版本,相关api可以直接调用。待后续更新为正式版本后,需要安装sdk后通过license激活使用。
请求结构
1POST /v{version}/aiagent/chat/completions/meeting-summary/create HTTP/1.1
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "task_key": "user_test_001",
6 "media_url": "https://gitee.com/zhuang-jialong/asr-test-files/raw/master/meeting_01_simulation_erp_crisis.mp3",
7 "language": "",
8 "ai_summary_enable": true,
9 "prompt_mode": "single",
10 "hotword_words": ["ERP", "SAP", "供应链"],
11 "ai_summary_module_names": ["basicInfo", "fullSummary", "segmentedSummary", "keyViewpoints", "todoList"]
12}
请求头域
除公共头域外,无其它特殊头域。(后续正式版需要携带 authorization )
请求参数
| 参数名称 | 类型 | 是否必选 | 参数位置 | 描述 |
|---|---|---|---|---|
| task_key | String | 否 | RequestBody | 任务key。用于关联用户业务数据,仅支持字母、数字、下划线(_)和连字符(-)。不传时随机生成8位字符串 |
| media_url | String | 是 | RequestBody | 会议内容地址。必须是公网可访问的 URL,支持格式: .mp3, .wav, .ogg, .raw |
| language | String | 否 | RequestBody | 会议语言。默认为中英文混合识别,可选值: zh_yue(粤语), zh_sc(四川话), zh_su(苏州话), en(英语), ja(日语), es(西班牙语), ko(韩语), de(德语), ar(阿拉伯语), id(印尼语), th(泰语), ms(马来语), pt(葡萄牙语) |
| ai_summary_enable | Blooean | 否 | RequestBody | 是否启用 AI 纪要。取值 true(启用), false(禁用),默认 true。若为 false 则仅进行 ASR 转写 |
| prompt_mode | String | 否 | RequestBody | AI 节点模式。single(单节点),double(双节点,默认), multi(多节点) |
| hotword_words | List<String> | 否 | RequestBody | ASR 热词列表,用于提高专有名词识别率。示例: ["元宇宙", "区块链", "GPT"] |
| ai_summary_module_names | List<String> | 否 | RequestBody | 指定纪要模块。可选值: basicInfo, fullSummary,segmentedSummary, keyViewpoints, todoList。不传则返回全部模块 |
响应头域
除公共头域外,无其它特殊头域。
响应参数
| 参数名称 | 类型 | 描述 |
|---|---|---|
| code | Integer | 请求状态码 |
| request_id | String | 请求ID,用于追踪请求 |
| message | String | 返回信息 |
| data | object | 数据 |
| ++ task_id | String | 任务ID |
| ++ task_key | String | 任务key |
请求示例
1POST https://gwgp-tdvpwojkegj.i.bdcloudapi.com/sse/v1/aiagent/chat/completions/timer/control
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "task_key": "user_test_001",
6 "media_url": "https://gitee.com/zhuang-jialong/asr-test-files/raw/master/meeting_01_simulation_erp_crisis.mp3",
7 "language": "",
8 "ai_summary_enable": true,
9 "prompt_mode": "single",
10 "hotword_words": ["ERP", "SAP", "供应链"],
11 "ai_summary_module_names": ["basicInfo", "fullSummary", "segmentedSummary", "keyViewpoints", "todoList"]
12}
响应示例
1{
2 "data":
3 {
4 "task_id": "f0d24027-520f-46fc-9cb2-2d0626f2875d",
5 "task_key": "user_test_001"
6 },
7 "code": 200,
8 "request_id": "b45885fa-c590-486d-b1e4-bc4cea36b7aa",
9 "message": "Task created successfully"
10}
查询会议纪要任务
接口描述
- 接口概述
本接口为开发者提供会议纪要任务结果查询能力。调用者输入任务ID,查询任务处理进度和结果。支持多种返回格式,包括:纯文本转写、JSON格式转写、SRT字幕格式、AI纪要结果等。
- 交互流程
用户提交任务ID查询处理结果,服务端返回任务状态和纪要内容。 - 权限说明
当前版本为调试版本,相关api可以直接调用。待后续更新为正式版本后,需要安装sdk后通过license激活使用。
请求结构
1POST /v{version}/aiagent/chat/completions/meeting-summary/query HTTP/1.1
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "task_id": "2faa0260-8675-418e-85de-815c8269092b",
6 "return_transcription_text": false,
7 "return_ai_summary_result": true,
8 "return_transcription_json": false,
9 "return_transcription_srt": false,
10 "return_hotword_words": false
11}
请求头域
除公共头域外,无其它特殊头域。(后续正式版需要携带 authorization )
请求参数
| 参数名称 | 类型 | 是否必选 | 参数位置 | 描述 |
|---|---|---|---|---|
| task_id | String | 是 | RequestBody | 任务ID,创建任务时返回的UUID |
| return_transcription_text | Boolean | 否 | RequestBody | 是否返回纯文本转写结果,默认值为false |
| return_ai_summary_result | Boolean | 否 | RequestBody | 是否返回AI纪要结果,默认值为false |
| return_transcription_json | Boolean | 否 | RequestBody | 是否返回JSON格式转写结果,默认值为false。注意:该字段体积较大,仅在需要词级时间戳或调试时开启 |
| return_transcription_srt | Boolean | 否 | RequestBody | 是否返回SRT字幕格式转写结果,默认值为false |
| return_hotword_words | Boolean | 否 | RequestBody | 是否返回热词列表(返回创建任务时传入的热词),默认值为false |
响应头域
除公共头域外,无其它特殊头域。
响应参数
| 参数名称 | 类型 | 描述 |
|---|---|---|
| code | Integer | 状态码,200表示成功 |
| message | String | 状态信息 |
| request_id | String | 请求ID,用于追踪 |
| data | Object | 响应数据对象 |
| ++ task_id | String | 任务ID |
| ++ task_key | String | 业务自定义任务标识 |
| ++ task_status | Integer | 任务状态:100-创建成功、200-处理中、300-完成、400-失败 |
| ++ task_message | String | 任务状态描述 |
| ++ media_url | String | 音频文件地址 |
| ++ language | String | 识别语言代码 |
| ++ prompt_mode | String | Prompt模式 |
| ++ ai_summary_module_names | List<String> | AI纪要模块列表 |
| ++ hotword_words | List<String> | 热词列表 |
| ++ create_time | Long | 任务创建时间(Unix时间戳,毫秒) |
| ++ task_start_time | Long | 任务开始处理时间(Unix时间戳,毫秒) |
| ++ task_end_time | Long | 任务结束时间(Unix时间戳,毫秒) |
| ++ task_duration_ms | Long | 任务总处理时长(毫秒) |
| ++ llm_total_tokens | Integer | LLM使用Token总数 |
| ++ download_info | Object | 下载信息 |
| ++++ download_status | Integer | 下载状态 |
| ++++ error_code | Integer | 下载错误码 |
| ++++ error_message | String | 下载错误信息 |
| ++ transcription | Object | 转写结果 |
| ++++ status | Integer | 转写状态:100-未开始、200-进行中、300-成功、400-失败 |
| ++++ audio_duration_ms | Long | 音频总时长(毫秒) |
| ++++ transcription_text | String | 纯文本转写结果 |
| ++++ transcription_json | String | JSON格式转写结果 |
| ++++ transcription_srt | String | SRT字幕格式转写结果 |
| ++ ai_summary | List<Obejct> | AI纪要模块状态列表 |
| +++ | object | |
| ++++ module_name | String | 模块名称 |
| ++++ status | Integer | 模块处理状态 |
| ++++ total_tokens | Integer | 模块总Token数 |
| ++ ai_summary_result | Object | AI纪要结果对象(需设置return_ai_summary_result=true) |
| ++++ data | Object | 结果数据 |
| ++++++ file | Object | 文件信息 |
| ++++++++ duration | Long | 音频时长(毫秒) |
| ++++++++ filename | String | 文件名 |
| ++++++++ title | String | 会议标题 |
| ++++++ ai_outline | Object | 纪要大纲 |
| ++++++++ data | List<object> | 纪要模块列表 |
| +++++++++ | object | |
| ++++++++++ module_id | Integer | 模块ID |
| ++++++++++ module_name | String | 模块名称 |
| ++++++++++ module_content | Object | 模块内容 |
| ++++++++++++ basic_info | Object | 基本信息 |
| ++++++++++++++ summary | String | 摘要 |
| ++++++++++++++ background | String | 背景 |
| ++++++++++++++ theme | String | 主题 |
| ++++++++++++++ time | String | 时间 |
| ++++++++++++++ place | String | 地点 |
| ++++++++++++++ participant | String | 参与者 |
| ++++++++++++ list_content | List<Object> | |
| +++++++++++++ | Object | |
| ++++++++++++++ id | Integer | 本层序号 |
| ++++++++++++++ number | String | 段落编号 |
| ++++++++++++++ title | String | 标题 |
| ++++++++++++++ content | String | 内容 |
| ++++++++++++++ list_content | List<Object> | 子列表(递归结构) |
| ++++++++++ markdown_content | String | Markdown格式内容 |
| ++++++++ module_status | Integer | 模块处理状态 |
| ++ hotword_words | List<String> | 热词列表(需设置return_hotword_words=true) |
1POST https://gwgp-tdvpwojkegj.i.bdcloudapi.com/v1/aiagent/chat/completions/meeting-summary/query
2Host: gwgp-tdvpwojkegj.i.bdcloudapi.com
3Authorization: Bearer string
4{
5 "task_id": "f87d96ea-5658-40c2-89e8-3314c71c0a8a",
6 "return_transcription_text": true,
7 "return_ai_summary_result": true,
8 "return_transcription_json": false,
9 "return_transcription_srt": true,
10 "return_hotword_words": true
11}
响应示例
1{
2 "code": 200,
3 "request_id": "f87d96ea-5658-40c2-89e8-3314c71c0a8f",
4 "message": "Success",
5 "data": {
6 "task_id": "da4fe9c0-a872-44a9-a721-303e97cd6e11",
7 "task_key": "",
8 "task_status": 300,
9 "task_message": "Success",
10 "media_url": "https://example.com/meeting.mp3",
11 "language": "",
12 "ai_summay_enable": null,
13 "prompt_mode": "double",
14 "ai_summary_module_names": null,
15 "hotword_words": null,
16 "create_time": 1773403844000,
17 "task_start_time": 1773403845000,
18 "task_end_time": 1773403874000,
19 "task_duration_ms": 29761,
20 "llm_total_input_tokens": 2452,
21 "llm_total_output_tokens": 3374,
22 "llm_total_tokens": 5826,
23 "download_info": {
24 "download_status": null,
25 "error_code": null,
26 "error_message": null
27 },
28 "transcription": {
29 "status": 300,
30 "asr_start_time": 1773403845000,
31 "asr_end_time": 1773403851000,
32 "asr_duration_ms": 5615,
33 "audio_duration_ms": 48780,
34 "transcription_text": "说话人1:各位,双十一大促的方案今天要定稿,小李,运营册准备的怎么样了?\n说话人2:张总,我们策划了三个核心活动,满减、秒杀和直播间抽奖,预算初步定在200万,预计能带来5倍 GMV 增长。\n说话人3:视觉素材我这边的初稿已经出了,但双十一的主题图还需要和小李那边再对一下活动规则,避免文案和设计不匹配。\n说话人1:那今天下午5点前,小李把活动规则文档发给王哥。\n说话人1:王哥明天中午前完成所有素材定稿,周五上午我们再过一遍。\n说话人2:收到,我下午3点前就发过去,确保王哥那边有足够时间调整。\n",
35 "transcription_json": null,
36 "transcription_srt": "1\n00:00:00,230 --> 00:00:05,710\n各位,双十一大促的方案今天要定稿,小李,运营册准备的怎么样了?\n\n2\n00:00:07,510 --> 00:00:17,390\n张总,我们策划了三个核心活动,满减、秒杀和直播间抽奖,预算初步定在200万,预计能带来5倍 GMV 增长。\n\n3\n00:00:19,300 --> 00:00:28,330\n视觉素材我这边的初稿已经出了,但双十一的主题图还需要和小李那边再对一下活动规则,避免文案和设计不匹配。\n\n4\n00:00:31,000 --> 00:00:34,680\n那今天下午5点前,小李把活动规则文档发给王哥。\n\n5\n00:00:35,080 --> 00:00:39,880\n王哥明天中午前完成所有素材定稿,周五上午我们再过一遍。\n\n6\n00:00:41,740 --> 00:00:47,060\n收到,我下午3点前就发过去,确保王哥那边有足够时间调整。\n\n"
37 },
38 "ai_summary": [
39 {
40 "module_name": "essentials",
41 "status": 300,
42 "error_code": null,
43 "error_message": null,
44 "start_time": 1773403851000,
45 "end_time": 1773403874000,
46 "duration_ms": 23666,
47 "input_tokens": 2115,
48 "output_tokens": 1924,
49 "total_tokens": 4039
50 },
51 {
52 "module_name": "segment",
53 "status": 300,
54 "error_code": null,
55 "error_message": null,
56 "start_time": 1773403851000,
57 "end_time": 1773403867000,
58 "duration_ms": 16601,
59 "input_tokens": 337,
60 "output_tokens": 1450,
61 "total_tokens": 1787
62 }
63 ],
64 "ai_summary_result": {
65 "data": {
66 "file": {
67 "duration": 48780,
68 "filename": "meeting_00_simple_discussion.mp3",
69 "title": "【双十一大促方案定稿会】核心活动与执行时间表"
70 },
71 "ai_outline": {
72 "data": [
73 {
74 "module_id": 1,
75 "module_name": "basicInfo",
76 "module_content": {
77 "basic_info": {
78 "summary": "确定满减、秒杀、直播间抽奖三大活动,预算200万预计5倍GMV增长;要求小李下午3点前发规则文档,王哥明中午前完成素材定稿。",
79 "background": "双十一大促临近,需快速确定活动方案以实现GMV增长目标",
80 "theme": "双十一大促活动方案定稿",
81 "time": "未提及",
82 "place": "未提及",
83 "participant": "张总、小李、王哥、视觉组负责人"
84 },
85 "list_content": [],
86 "markdown_content": ""
87 },
88 "module_status": 300
89 },
90 {
91 "module_id": 2,
92 "module_name": "fullSummary",
93 "module_content": {
94 "basic_info": null,
95 "list_content": [
96 {
97 "id": 1,
98 "number": "1.1",
99 "title": "双十一大促方案定稿",
100 "content": "",
101 "list_content": [
102 {
103 "id": 1,
104 "number": "1.1.1",
105 "title": "活动策划",
106 "content": "确定满减、秒杀和直播间抽奖三大核心活动,预算200万,预计带来5倍GMV增长。",
107 "list_content": []
108 },
109 {
110 "id": 2,
111 "number": "1.1.2",
112 "title": "执行时间表",
113 "content": "小李需下午3点前提交活动规则文档至王哥;王哥须明中午前完成所有视觉素材定稿;周五上午进行最终审核。",
114 "list_content": []
115 },
116 {
117 "id": 3,
118 "number": "1.1.3",
119 "title": "跨部门协作",
120 "content": "视觉组强调需与运营组对齐活动规则,避免文案与设计不匹配,确保执行一致性。",
121 "list_content": []
122 }
123 ]
124 }
125 ],
126 "markdown_content": ""
127 },
128 "module_status": 300
129 },
130 {
131 "module_id": 3,
132 "module_name": "segmentedSummary",
133 "module_content": {
134 "basic_info": null,
135 "list_content": [
136 {
137 "id": 1,
138 "number": "2.1",
139 "title": "运营方案讨论",
140 "content": "核心讨论点:Speaker2汇报了双十一大促的运营方案细节,包括策划的三个核心活动(满减、秒杀和直播间抽奖),预算初步定为200万,并预计能带来5倍GMV增长。",
141 "list_content": []
142 },
143 {
144 "id": 2,
145 "number": "2.2",
146 "title": "视觉素材协调",
147 "content": "核心讨论点:Speaker3指出视觉素材初稿已完成,但双十一主题图需与小李核对活动规则,以避免文案和设计不匹配的问题。",
148 "list_content": []
149 },
150 {
151 "id": 3,
152 "number": "2.3",
153 "title": "时间安排确认",
154 "content": "核心讨论点:Speaker1指定小李需于今天下午5点前将活动规则文档发送给王哥,王哥需在明天中午前完成所有素材定稿,并计划于周五上午再次审核;Speaker2确认将按要求于下午3点前发送文档,确保王哥有足够时间调整。",
155 "list_content": []
156 }
157 ],
158 "markdown_content": ""
159 },
160 "module_status": 300
161 },
162 {
163 "module_id": 4,
164 "module_name": "keyViewpoints",
165 "module_content": {
166 "basic_info": null,
167 "list_content": [
168 {
169 "id": 1,
170 "number": "3.1",
171 "title": "双十一大促方案定稿",
172 "content": "张总:要求明确时间节点,确保小李下午5点前提交活动规则文档,王哥明中午前完成素材定稿。\n小李:汇报三大活动方案细节,承诺下午3点前提交文档,保障王哥有充足调整时间。\n视觉组:初稿已出,需与小李对齐活动规则,避免文案与设计不匹配。",
173 "list_content": []
174 }
175 ],
176 "markdown_content": ""
177 },
178 "module_status": 300
179 },
180 {
181 "module_id": 5,
182 "module_name": "todoList",
183 "module_content": {
184 "basic_info": null,
185 "list_content": [
186 {
187 "id": 1,
188 "title": "待办事项 1",
189 "content": "[小李] 提交双十一大促活动规则文档 (截止: 今天下午3点)",
190 "list_content": []
191 },
192 {
193 "id": 2,
194 "title": "待办事项 2",
195 "content": "[王哥] 完成所有视觉素材定稿 (截止: 明天中午)",
196 "list_content": []
197 }
198 ],
199 "markdown_content": ""
200 },
201 "module_status": 300
202 }
203 ]
204 }
205 }
206 }
207 }
208}
评价此篇文章
