Soul App端到端语音通话大模型升级上线

简介：Soul App近日上线自研端到端全双工语音通话大模型，具备超低延迟、自动打断、真实声音表达及情绪感知能力，实现更自然的人机交互和类真人情感陪伴，已应用于“异世界回响”等场景。

在人工智能技术日新月异的今天，社交平台Soul App（以下简称“Soul”）再次以技术创新引领行业发展，自研端到端全双工语音通话大模型正式上线。这一升级不仅标志着Soul在语音技术领域的又一重大突破，也为用户带来了更加自然、流畅、沉浸式的社交体验。

一、端到端语音通话大模型的核心优势

Soul此次上线的自研端到端全双工语音通话大模型，具备多项先进技术特性，包括但不限于超低交互延迟、快速自动打断、超真实声音表达以及丰富的情绪感知理解能力。这些特性共同构成了模型的核心优势，使得用户在与AI的交互过程中能够获得更加贴近真人的交流体验。

超低交互延迟：在实际应用中，用户体验与“异世界回响”中虚拟人实时语音通话时，延迟时间少于行业平均水平，真正实现了即时的AI交流和陪伴。
快速自动打断：模型能够迅速识别并响应用户在对话中的打断行为，使得对话更加自然流畅。
超真实声音表达：支持多种风格的声音表达，包括模拟真实音色、语音DIY等，为用户带来更加丰富的听觉享受。
情绪感知理解能力：模型能够精准感知并理解用户的情绪变化，给予有温度的回应和情感关怀。

二、技术创新与积累

自2016年上线以来，Soul一直致力于以创新的技术方案和产品设计来拓展社交体验。特别是在2020年启动对AIGC技术的研发工作后，Soul在智能对话、语音技术、虚拟人等关键技术领域取得了显著进展。

系统推进AIGC技术：Soul系统推进了AIGC技术在智能对话、语音技术、虚拟人等领域的研发工作，并成功将这些技术融入到了实际的产品应用中。
国际赛事获奖：在今年7月举办的人工智能领域顶级国际学术会议——国际人工智能联合会议（IJCAI）的第二届多模态情感识别挑战赛（MER24）上，Soul语音技术团队在半监督学习（SEMI）赛道荣获第一名，充分展示了其在AI领域的前沿洞察和技术能力。

三、应用场景与未来展望

目前，Soul自研的端到端语音通话大模型能力已上线旗下“异世界回响”实时通话场景（内测中），并将在后续拓展至AI苟蛋等多个AI陪伴、AI互动场景。

“异世界回响”实时通话场景：用户可以在这个场景中与虚拟人进行实时语音通话，体验超低延迟、真实声音表达以及情感陪伴等特性。
AI苟蛋等互动场景：未来，Soul计划将这一技术拓展至更多AI陪伴、AI互动场景，如AI苟蛋等，让用户可以与AI进行更加有温度、沉浸、趣味的互动交流。

四、产品关联：千帆大模型开发与服务平台

在Soul此次语音大模型升级的背后，离不开千帆大模型开发与服务平台的支持。作为专业的AI模型开发平台，千帆大模型开发与服务平台为Soul提供了强大的技术支撑和丰富的资源保障。

技术支撑：千帆大模型开发与服务平台提供了先进的算法框架和计算资源，使得Soul能够高效地开发和训练端到端语音通话大模型。
资源保障：平台还提供了丰富的数据资源和模型库，为Soul的模型优化和迭代提供了有力支持。

通过千帆大模型开发与服务平台的助力，Soul得以在语音技术领域不断取得突破，为用户带来更加智能化、人性化的社交体验。

五、总结