了解了它是谁,我们再来看看它能为我们做什么? AppBuilder能做什么 该平台主要提供组件、框架两层服务。 “组件”服务是对底层服务能力的组件化封装,包括 多模态的AI能力组件 (如文字识别、文生图等)、 基于大语言模型的能力组件 (如长文总结、nl2sql等) 和基础组件 (如向量数据库、对象存储等),每个组件完成一个特定的功能。
了解了它是谁,我们再来看看它能为我们做什么? AppBuilder能做什么 该平台主要提供组件、框架两层服务。 “组件”服务是对底层服务能力的组件化封装,包括 多模态的AI能力组件 (如文字识别、文生图等)、 基于大语言模型的能力组件 (如长文总结、nl2sql等) 和基础组件 (如向量数据库、对象存储等),每个组件完成一个特定的功能。
请确保库文件在工程所能找到的位置之内(通过 LIBRARRY_SEARCH_PATH设置) 添加语音合成相关资源文件 将开发包中的BDSClientResource目录下的相关资源文件添加到工程或者安装app后部署到指定目录(代码中启动合成引擎时需要指定该资源文件的访问路径)。根据具体需求引入不同的资源即可。
更多精选案例 点击下载 使用产品/方案 对象存储BOS 音视频直播LSS 文字识别离线SDK 相关案例 狮桥物流 好看视频 项目背景 “怀孕了怎么办?上宝宝知道啊。” 在宝宝知道APP中,有用户这样写到。由此可见,这款APP的影响。 宝宝知道是一款四端产品,包括APP、小程序、WAP、PC ,面向备孕、孕期、0-6岁育儿期用户的母婴知识社区+孕育助手,为亿万妈妈提供专业知识和服务,全网流量过亿。
取代人工服务,处理效率提升300% 使用产品: 身份证识别 查看详情 全部案例 行业类型: 全部 教育培训 文化娱乐 交通出行 电子商务 金融 零售 酒店旅游 企业服务 物流货运 生活服务 医疗健康 房产家装 商业地产 智能硬件 制造业 农业 法律政务 安防监控 软件工具 新闻媒体 智能手机 视频直播 游戏 其它 更多 技术方向: 全部 语言理解技术 文本审核 文字识别 语音识别 人脸识别 时间从近到远
解决方案 度小满支付通过结合自身技术+百度OCR文字识别-卡片证照识别(银行卡识别)能力,实现用户在注册绑卡环节,直接拍照扫描提取银行卡号。 第一步:进入银行卡添加界面,选择要绑定的银行卡。 通过自身技术(预处理)+百度OCR文字识别-卡片证照识别(银行卡识别)接口能力,对需绑定的银行卡进行识别读取。
由于底层识别使用的是pcm,因此推荐直接上传pcm文件。如果上传其它格式,会在服务器端转码成pcm,调用接口的耗时会增加。 音频参数概念 采样率: 百度语音识别一般仅支持16000的采样率。即1秒采样16000次。 位深: 无损音频格式pcm和wav可以设置,百度语音识别使用16bits 小端序 ,即2个字节记录1/16000 s的音频数据。 声道: 百度语音识别仅支持单声道。
使用产品 iOCR自定义模板文字识别 支持与交流 AI社区 教学视频 文档中心 SDK下载 iOCR助力医疗处方电子化,配药流程精准高效 价值成果 唐古信息研发团队通过使用百度大脑iOCR自定义模板文字识别接口,实现了纸质处方的结构化识别并形成电子处方,医师可通过高拍仪或微信小程序拍照上传电子处方至配方系统,方便工作人员快速抓药和煎药。配方煎药流程的改进有效避免了人工录入的失误,同时又提升了效率。
如何能让用户很便捷的进行实际场景模拟练习口语,成为我们开发此款软件的目标。 解决方案 我们制作了一款面对全年龄用户的英语口语教学软件《恋爱口令》。用虚拟人物代替真人,用户可以用手机即可随时随地都与“他/她”进行英语交流。 此款软件通过内置百度AI的语音合成以及语音识别技术,访问用户手机麦克风,收集用户语音数据,识别用户英语发音,列出错误发音单词。
使用产品 智能对话定制与服务平台UNIT 语音识别 语音合成 语音唤醒 支持与交流 AI社区 教学视频 文档中心 SDK下载 小致语音助手:UNIT开启企业智能办公日常 价值成果 “小致语音助手”是一个能听、会说、能思考、会分析的智能助手,为用户提供了随时且亲切的服务。