产品优势
实时音视频RTC
高音质
业内领先的 3A 算法,支持 48kHz 采样的高音质,AI 降噪算法能识别多种场景噪声,可在嘈杂的环境下有效消除噪声,无回声、无啸叫,保持清晰流畅的纯净人声,实现沉浸式互动通话体验
高画质
支持H.264、H.265编码方式,提供视频超分、画质增强、背景分割、基础美颜、视频水印、截图等多种视频处理能力,最高可支持4K超高画质,为用户提供极佳的画质体验
超低延时
依托百度智能云强大的实时音视频处理与传输能力、覆盖全球的低延时网络,在全球范围内提供稳定高质量的实时音视频服务,基于用户距离、节点质量、网络质量探测,自动配置最佳路由,保障用户就近接入,端到端延时低至300毫秒
弱网优化
自研抗弱网算法策略,在弱网丢包恢复中,NACK会和FEC结合使用,针对不同网络环境匹配不同策略,动态调整NACK和FEC比例,平衡带宽和延时,实时精准估计网络状态、动态调整码率。支持多卡聚合传输,在网络信号波动或断网时,有效解决不同位置单一运营商网络覆盖和质量不可靠的问题,提高带宽传输上限,通过实时监测网络变化和连通性,自动选择最优运营商网络通道进行实时音视频传输,音视频抗丢包达70%,抗网络抖动达1000ms
IoT设备适配
针对手表、门锁、无人车等多种物联网设备,可提供轻量级、低功耗的SDK,最小包体<300K,CPU最低运算速度<300MHz,主体程序运行内存<2M,已适配ASR、乐鑫、展锐等多款主流芯片,优化超分算法提升低分辨率视频的清晰度,满足用户清晰流畅的通话体验
全平台互通
提供全平台覆盖的实时音视频SDK及服务端RESTful API,实现跨平台音视频通话,支持Android、IOS、Web、Windows、MacOS、微信小程序、Flutter、Linux、Rtos等多平台全球互通
大模型实时互动
超低延时互动
语音互动端到端响应延时1.4s,语音打断响应延时0.8s以内,超低延时互动,交互更流畅
丰富应用资源
打通百度丰富的生态资源,提供30+应用和资源,如百度百科、音乐、经典故事、有声读物、翻译、导航等,降低开发者对接成本
全链路音频增强
支持AI降噪、声音增益、回声消除、人声分离、声纹识别、VAD检测、智能打断,7大音频增强,云+端协同,有效提升互动体验性
开放式LUI互动框架
核心服务组件(LLM/TTS)可替换,支持Function Call自定义配置,满足满足个性化需求
全平台支持
提供开箱即用的互动SDK,只需要调用几个接口就可以快速集成多模态互动功能,支持Android、iOS、Web、小程序、Linux、RTOS等多个端,RTOS已适配杰理、乐鑫、ASR、移远、BK、RK等多款主流芯片