Android SDK

更新时间：2025-11-05

初始化接口

SDK初始化

                Java
                
            

                    /** 初始化Engine */
    public static AIAgentEnginImpl init(Context context, AIAgentEngineParams params)
    
    public static class AIAgentEngineParams {
        /** appid */
        public String appId = "";
        /** 调试开关 */
        public boolean verbose = false;
        /** 开启终端侧TTS */
        public boolean enableTerminalTTS = false;
        /** 强制打开软件音频回音消除 （部分硬件不支持回音消除需要打开该参数）*/
        public boolean forceSoftEchoCancellation = false;
        /** 强制关闭蓝牙操作 */
        public boolean disableBluetooth = false;
        /** 实例id  服务器端下发，当前调试默认即可 */
        public long aiAgentInstanceId = 0;
        /**容许外部输入音频, 通过接口 pushAudioFrame 输入音频PCM数据 */
        public boolean enableExternalAudioInput = false;
        /**容许外部输出音频，通过接口回调 onPlaybackAudioFrame 返回音频PCM数据 */
        public boolean enableExternalAudioOutput = false;
        /** dump 采集音频 */
        public boolean dumpAudioInput = false;
        /** 音频source */
        public int inputAudioSource = -1;
        /** 工作流类型，默认用VoiceChat */
        public String workflow = "VoiceChat";
        /** 音频编码器 默认opus */
        public String audioCodec = RtcParameterSettings.AudioCodecId.OPUS;
        /** 回音消除配置 */
        public int audioEchoCancellationType = Constants.AudioEchoCancellationType.HARD_WARE;
        /** 打开日志回调 */
        public boolean enableLogCallback = false;
        /** 日志写磁盘 */
        public boolean enableLogWriteToDisk = false;
        /** 默认speech模式 */
        public int audioContentType = AudioAttributes.CONTENT_TYPE_SPEECH;
        /** 软件回声消除等级，如果使用硬件回声消除不用配置该参数 */
        public int aecLevel = -1;
        /** 自定义信令服务器地址 */
        public String signalServerUrl;        
        
        /**
         * 海外服务器 配置, 中国大陆使用不用填该配置
         * 欧美 {@link Constants.AgentRegionType#europeAmerica }
         * */
        public String regionServer;
        /** 授权key 信息 */
        public String licenseKey;
        /** 用户id */
        public String userId;        
        /** 服务器端接口下发 cid, token */
        public String context = "{ "cid": 1, "token": "xxx-aa-bb" }";
    }
            

SDK初始化。

参数

参数	类型	描述
context	Context	Android上下文环境
params	AIAgentEngineParams	Engine初始化参数

AIAgentEnginImpl 实例对象：成功； null：失败；

设置回调

                Java
                
                    public abstract void setCallback(AIAgentEngineCallback callback);

参数

参数	类型	描述
callback	AIAgentEngineCallback	事件回调接口

无

Agent相关接口

开启通话

                Java
                
                    public abstract void call(String token， long instanceId);

开启通话，开始音频采集和音频播放；

参数

参数	类型	描述
token	String	鉴权token
instanceId	long	实例id

无

结束通话

                Java
                
                     public abstract void hangup();

结束通话，停止音频采集和音频播放；

参数

参数	类型	描述

无

发送文本

                Java
                
                     public abstract void setTextToAIAgent(String text);

发送文本消息给智能体，作为query向大模型进行提问；

参数

参数	类型	描述
text	String	文本query

无

发送文本并且打断

                Java
                
                     public abstract void sendTextToAIAgentAndInterrupt(String text);

发送文本消息给智能体，作为query向大模型进行提问，并且立即打断当前播报；

参数

参数	类型	描述
text	String	文本query

无

发送增强文本

                Java
                
                    public abstract void updateEnhanceQuery(String enhanceType, String preQuery, String postQuery);

发送文本消息给智能体，作为query向大模型进行提问；

参数

参数	类型	描述
enhanceType	String	插入类型 `0:不插入` `1:前插` `2:后插` `3:前后插`
preQuery	String	前插入文本
postQuery	String	后插入文本

设置后所有请求默认都会附加增强信息，用于引导模型，需要

无

发送三方人设提示

                Java
                
                    public abstract void updateHintHistory(String hintType, String question, String answer);

更新三方人设历史消息提示

参数

参数	类型	描述
hintType	String	插入类型 `0:不插入` `1:前插` `2:后插` `3:前后插`
question	String	"回答要求：每次回复不超过100字，要求使用xx风格回答"
answer	String	"好的"

无

发送文本直接播报

                Java
                
                     public abstract void sendTextToTTS(String text);

发送文本消息给TTS模块直接进行播报；

参数

参数	类型	描述
text	String	TTS播报文本

无

主动打断(1)

                Java
                
                    public abstract void interrupt();

打断当前播报内容，停止播放；

参数

参数	类型	描述

无

主动打断(2)

                Java
                
                    public abstract void interrupt2(boolean begin, int delay);

打断当前播报内容，停止播放；

参数

参数	类型	描述
begin	bool	true 开始打断延时 false 立即取消延时打断
delay	int	仅仅在开始打断时候生效，必须大于0 单位毫秒

无

销毁Engine

                Java
                
                    public abstract void destroy();

销毁Engine，释放资源；

无

发送FunctionCall结果

                Java
                
                    public abstract void sendFunctionCallResult(String id, String result);

发送FunctionCall结果；

参数

参数	类型	描述
id	String	唯一表示
result	String	结果例如： `{"result":"ok"}`

无

发送命令

                Java
                
                    public abstract void sendCommand(String text);

发送内置命令

参数

参数	类型	描述
text	String	命令例如： `[PAUSE]` 智能体暂停 `[RESUME]` 智能体恢复

无

设置数字人View

                Java
                
                    public abstract void setDigitalDisplay(ViewGroup viewGroup, ViewGroup.LayoutParams params, RTCVideoView.ScalingType type);

设置数字人视图；

参数

参数	类型	描述
viewGroup	ViewGroup	父容器
params	ViewGroup.LayoutParams	布局参数
type	RTCVideoView.ScalingType	缩放模式, 支持模式： `RTCVideoView.ScalingType.SCALE_ASPECT_FIT` `RTCVideoView.ScalingType.SCALE_ASPECT_FILL`

无

上传文件

                Java
                
                     public abstract boolean uploadFile(String path, int expire);

上传文件会收到 onUploadFileStatus 事件回调

注意暂时仅仅支持 JPEG/PNG/JPG 三种数据格式，并且大小不超过7MB;

参数

参数	类型	描述
path	String	文件路径，必须具有可读权限
expire	int	过期时间单位秒, 最大值默认180秒（图片支持多轮次会话引用时间），最小值0 （图片仅仅支持一轮会话引用）

无

音频相关接口

静音播放

                Java
                
                    public abstract void mutePlayback(boolean isMute);

音频播放声音控制；

参数

参数	类型	描述
isMute	boolean	是否静音

无

静音麦克风

                Java
                
                    public abstract void muteMic(boolean isMute);

音频采集声音控制；

参数

参数	类型	描述
isMute	boolean	是否静音

无

扬声器播放

                Java
                
                    public abstract void switchToSpeaker(boolean speaker);

声音使用扬声器播放控制；

参数

参数	类型	描述
speaker	boolean	是否使用扬声器播放

无

注册外部TTS

                Java
                
                    public abstract void registerExternalTTS(Constants.TTSService service);
    
    /** TTS 服务 */
    public static interface TTSService {
        /** 停止播放TTS，打断语音TTS播报时候调用,建议mute speaks 1000ms */
        public void onStop();

        /** 开始TTS */
        public void onStart(String msg);
    }

注册外部TTS服务

参数

参数	类型	描述
service	Constants.TTSService	外部tts服务

无

外部音频采集（1）

                Java
                
                        public abstract void pushAudioFrame(byte[] data, long timestamp, int sampleRate, int channels);

外部音频采集

注意接入方负责将音频输入PCM 输入进入（当前要求16K音频采样，单声道, AudioFormat.ENCODING_PCM_16BIT），每次输入10ms音频数据长度；

参数

参数	类型	描述
data	byte数组	PCM音频数据, 单声道, AudioFormat.ENCODING_PCM_16BIT, 10ms 音频数据长度 320字节
timestamp	long	时间戳
sampleRate	int	音频采样率使用16K音频采样率
channels	int	音频声道数

无

外部音频采集（2）

                Java
                
                        public abstract void pushAudioFrame(ByteBuffer data, long timestamp, int sampleRate, int channels);

外部音频采集

注意接入方负责将音频输入PCM 输入进入（当前要求16K音频采样，单声道, AudioFormat.ENCODING_PCM_16BIT），每次输入10ms音频数据长度；

参数

参数	类型	描述
data	ByteBuffer	PCM音频数据, 单声道, AudioFormat.ENCODING_PCM_16BIT, 10ms 音频数据长度 320字节
timestamp	long	时间戳
sampleRate	int	音频采样率使用16K音频采样率
channels	int	音频声道数

无

事件回调

AIAgent 回调

错误回调

                Java
                
                    public void onError(int error, String msg, Bundle bundle)

出错回调，出错后需要结束通话；

参数

参数	类型	描述
error	int	错误码
msg	String	错误信息
bundle	Bundle	错误描述详细信息

通话状态变化

Plain Text

1public void onCallStateChange(int state);

通话状态变化；

参数

参数	类型	描述
state	int	开始通话 `{@link Constants.CallState#ON_CALL_BEGIN }` 结束通话 `{@link Constants.CallState#ON_CALL_END }`

链接状态变化

                Java
                
                    public void onConnectionStateChange(int state);

通话状态变化；

参数

参数	类型	描述
state	int	链接断开 `{@link Constants.ConnectionState#CONNECTION_STATE_DISCONNECTED }` 重连接 `{@link Constants.ConnectionState#CONNECTION_STATE_RECONNECTING }` 链接成功 `{@link Constants.ConnectionState#CONNECTION_STATE_CONNECTED }`

用户端ASR结果

                Java
                
                    public void onUserAsrSubtitle(String text, boolean isFinal, Constants.ASRExtInfo info);

用户端ASR结果；

参数

参数	类型	描述
text	String	ASR识别结果
isFinal	boolean	标记是否最终结果
info	Constants.ASRExtInfo	asr 扩展信息

                Java
                
            

                    // ASR 扩展信息
    public static class ASRExtInfo {
        /** 说话人标识 */
        public String speakerName;
        /** 声纹 置信度 */
        public int similarity;
        /** 情感名称 */
        public String emotion;
        /** 标识当前句子id */
        public long sessionId;
    }
            

AI智能体结果

                Java
                
                    public void onAIAgentSubtitle(String text, boolean isFinal);

AI智能体结果；

参数

参数	类型	描述
text	String	智能体结果
isFinal	boolean	标记是否最终结果

AI智能体音频状态变化

                Java
                
            

                    public void onAIAgentAudioStateChange(@Constants.AIAgentAudioStateType int newState);
    
    /** 智能体音频状态 */
    @Retention(RetentionPolicy.SOURCE)
    public @interface AIAgentAudioStateType {
        /** 大模型停止说话 */
        int STOPPED = 1;
        /** 大模型说话 */
        int SPEAKING = 2;
    }
            

AI智能体音频状态变化；

参数

参数	类型	描述
newState	@Constants.AIAgentAudioStateType int	音频状态

用户音频状态变化

                Java
                
            

                    public void onUserAudioStateChange(@Constants.UserAudioStateType int newState);
    
    /** 用户音频状态 */
    @Retention(RetentionPolicy.SOURCE)
    public @interface UserAudioStateType {
        /** 用户停止说话*/
        int STOPPED = 1;
        /** 用户说话*/
        int SPEAKING = 2;
    }
            

用户声音状态变化；

参数

参数	类型	描述
newState	@Constants.UserAudioStateType int	音频状态

智能体音频能量回调

                Java
                
                    public void onAIAgentAudioLevel(int level);

智能体音频能量回调，间隔100ms回调一次；

参数

参数	类型	描述
level	int	音频能量

用户音频能量回调

                Java
                
                    public void onUserAudioLevel(int level);

用户音频能量回调，间隔100ms回调一次；

参数

参数	类型	描述
level	int	音频能量

functionCall回调

                Java
                
                    public void onFunctionCall(String id, String func, String params);

用户收到function call, 处理完成后需要调用 sendFunctionCallResult

参数

参数	类型	描述
id	String	单次function call唯一标识
func	String	函数名
params	String	参数一般是json string 例如: `{"function_name":"phone_call","parameter_list":[{"called_number":"1891017000"},{"called_name":"我的父亲"}`

文件上传状态

                Java
                
                    public void onUploadFileStatus(int code, String msg)

文件上传后状态回调

参数

参数	类型	描述
code	int	成功 `{@link Constants#NO_ERROR }` 失败其他错误码
msg	String	成功时候返回文件名，失败时候返回错误消息

鉴权结果回调

                Java
                
                    public void onLicenseStatus(int code)

鉴权状态回调

参数

参数	类型	描述
code	int	成功 `{@link Constants#NO_ERROR }` 失败其他错误码

外部音频播放回调

                Java
                
                    public void onPlaybackAudioFrame(byte[] data, int sampleRate, int channelCount)

当打开外音频播放 AIAgentEngine.AIAgentEngineParams#enableExternalAudioOutput ，有该回调事件；

注意预期这里直接将音频输入给AudioTrack，如果不输入到AudioTrack，这里需要 TimeUnit.MILLISECONDS.sleep(10);

参数

参数	类型	描述
data	byte数组	PCM音频数据
sampleRate	int	采样率
channelCount	int	声道数

agent意图

                Java
                
                    public void onAgentIntent(String type, Bundle bundle)

意图回调

当前仅仅支持 Constants.AgentIntentType#IMAGE_UPLOAD和Constants.AgentIntentType#AGENT_EVENT_PLAY_AUDIO;

参数

参数	类型	描述
type	String	图片上传: `{@link Constants.AgentIntentType#IMAGE_UPLOAD }` 播放音频: `{@link Constants.AgentIntentType#AGENT_EVENT_PLAY_AUDIO }`
bundle	Bundle	其他附加信息

服务端API

iOS SDK

RTC 实时音视频