曦灵AI手语平台搭建听障沟通新桥梁

作者:蛮不讲李2024.11.25 19:26浏览量:2

简介:百度智能云曦灵正式发布AI手语平台,该平台可实现分钟级生成手语合成视频及实时直播能力,为听障人士搭建无障碍信息通道。通过该技术,听障人士能更便捷地获取信息,享受科技带来的便利。

在社会的各个角落,听障人士常常面临着信息获取的难题,他们难以像普通人一样轻松理解外界传递的声音信息。然而,随着科技的进步,这一困境正在逐步得到改善。百度智能云曦灵,作为百度推出的数字人平台,近期正式发布了其AI手语平台,为听障人士搭建起了一座沟通的桥梁。

曦灵AI手语平台的诞生背景

我国拥有庞大的听障人群,他们的生活质量和社会参与度直接受到信息无障碍环境的影响。然而,现实中无障碍窗口稀缺,专业手语翻译人数严重不足,这使得听障人士在信息获取上遇到了巨大障碍。根据统计数据,我国听力语言残疾人数量高达2780万以上,而专业的手语翻译却不足1万人,这一巨大的需求缺口亟待填补。

为了响应国家《无障碍环境建设“十四五”实施方案》的号召,百度智能云曦灵凭借其强大的AI技术,推出了AI手语平台。该平台旨在通过科技手段,降低手语翻译的成本,提高部署效率,为听障人士提供便捷、高效的信息获取渠道。

曦灵AI手语平台的功能与特点

曦灵AI手语平台由AI手语平台和AI手语平台一体机两部分组成。AI手语平台具备视频手语合成、直播手语合成、文本转手语、语音转手语四大功能,可以满足线上线下的多种场景需求。而AI手语平台一体机则包括全离线一体机和端云结合一体机两种,它们可以插电即用,操作简单,适用于医院、银行、车站等多种公共场合。

曦灵AI手语平台的特点主要体现在以下几个方面:

  1. 听得清:通过SMLTA语音识别算法模型,实现声学、语言一体化端到端建模语音识别,确保语音识别的清晰度。该模型在手机端近场语音识别率可达98%以上,针对不同领域的词准率也可进行针对性训练,使得AI手语平台一体机能够更好地应用于不同场景中。
  2. 翻得准:百度研发了首个基于神经网络的精炼度可控手语翻译模型,并联合手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等制定了自然手语标注规范,建设了大规模自然手语翻译语料库。这使得模型可以从真实数据中学习手语翻译知识,生成符合听障人群习惯的自然手语。
  3. 打得好:通过动作融合算法,基于《国家通用手语词典》规范精修近11000多个手语动作,确保手语动作的流畅度。同时,配合4D扫描技术训练,使得AI手语数字人表情自然生动,口型生成准确度高达98.5%。
  4. 部署快:AI手语平台可以实现线上小时级部署,线下插电即用,快速建立无障碍窗口。
  5. 产出快:千字文本转手语合成仅需要几秒钟,大大提高了手语视频的生成效率。

曦灵AI手语平台的应用案例与效果

曦灵AI手语平台已经在多个场景中得到了应用,并取得了显著的效果。例如,在央视新闻客户端上,AI手语主播已经上岗,为听障人士提供24小时手语翻译服务。此外,AI手语平台一体机也在医院、银行、车站等公共场合得到了广泛应用,为听障人士提供了便捷的信息获取渠道。

通过曦灵AI手语平台的应用,听障人士可以更加便捷地获取信息,参与社会活动,提高他们的生活质量和社会参与度。同时,这也为社会的无障碍环境建设做出了积极贡献。

曦灵数字人平台的升级与发展

除了AI手语平台外,曦灵数字人平台还在不断升级和发展。百度智能云曦灵数字人平台4.0的发布,将3D超写实数字人的价格从万元大幅降价至199元,达到了业内最低价。这使得更多企业和个人能够负担得起数字人的制作和运营成本,推动了数字人技术的普及和应用。

未来,随着技术的不断进步和应用场景的不断拓展,曦灵数字人平台将在更多领域发挥重要作用。它将成为推动社会进步和发展的重要力量之一。

结语

曦灵AI手语平台的发布为听障人士搭建起了一座沟通的桥梁,让他们能够更加便捷地获取信息、参与社会活动。这是科技赋能社会的具体体现之一。我们相信,在科技的不断推动下,社会的无障碍环境将越来越完善,听障人士的生活质量和社会参与度也将不断提高。同时,我们也期待曦灵数字人平台在未来能够发挥更大的作用,为社会的进步和发展做出更多贡献。