百度曦灵AI手语平台搭建听障沟通桥梁

作者:rousong2024.11.28 18:05浏览量:3

简介:百度智能云曦灵正式发布AI手语平台及一体机,通过分钟级生成手语合成视频、实时直播等能力,为听障人士提供无障碍信息通道。该平台已应用于央视新闻等场景,助力无障碍环境建设。

在科技日新月异的今天,人工智能正以前所未有的方式改变着我们的生活。其中,百度智能云曦灵-AI手语平台的发布,为听障人士搭建了一座沟通的“有声桥梁”,让信息无障碍成为了可能。

背景与需求

据统计,我国听力语言残疾人数量高达2780万以上,而专业的手语翻译却不足1万人,这一巨大的需求缺口使得听障人士在日常生活中面临着诸多不便。尤其是在医院、银行、车站等公共场合,无障碍窗口的稀缺问题尤为突出。为了解决这一难题,百度智能云曦灵在2022年3月3日正式发布了AI手语平台及一体机。

平台功能

百度曦灵AI手语平台具备四大核心功能:视频手语合成、直播手语合成、文本转手语、语音转手语。这些功能使得平台能够轻松应对线上线下的各种场景,为听障人士提供全方位的信息无障碍服务。

  • 视频手语合成:可以将普通视频内容实时转换为手语视频,适用于新闻、电影、电视剧等场景。
  • 直播手语合成:在实时直播中增加手语画面,让听障人士也能及时获取直播信息。
  • 文本转手语:将文字内容转换为手语,支持新闻、文档、小说等多种图文场景。
  • 语音转手语:通过语音识别技术,将语音内容实时翻译为手语,适用于语音通话、语音助手等场景。

技术亮点

百度曦灵AI手语平台之所以能够实现如此高效、准确的手语翻译,得益于其背后的强大技术支持。

  • SMLTA语音识别算法模型:该模型实现了声学、语言一体化端到端建模语音识别,在手机端近场语音识别率可达98%以上。针对不同领域,如旅游、医院、司法等,还可以进行针对性训练,提高词准率。
  • 精炼度可控手语翻译模型:百度研发了首个基于神经网络的精炼度可控手语翻译模型,并联合手语语言学专家、特殊教育专家以及天津理工大学聋人工学院等制定了自然手语标注规范,建设了大规模自然手语翻译语料库。这使得模型能够生成符合听障人群习惯的自然手语。
  • 动作融合算法:基于《国家通用手语词典》规范,平台精修了近11000多个手语动作,通过动作融合算法,让每一个动作的起落之间自然衔接,带来真人手语般地连贯性表达。再配合4D扫描技术训练,使得AI手语数字人表情自然生动,口型生成准确度高达98.5%。

应用场景

百度曦灵AI手语平台及一体机已经广泛应用于各个领域,为听障人士带来了极大的便利。

  • 线上场景:平台可以搭载在各类APP、网站、小程序中,让听障人士轻松实现线上社交、娱乐休闲、课程学习等各类需求。例如,央视新闻客户端就已经应用了该平台,为听障观众提供了手语直播服务。
  • 线下场景:一体机产品可以通过规模化部署快速建立无障碍窗口,插电即用、操作简单。在医院、银行、机场等公共场合,一体机可以为听障人士提供及时的手语翻译服务,缓解无障碍窗口短缺的困境。

社会意义

百度曦灵AI手语平台的发布,不仅为听障人士提供了便捷的信息无障碍服务,更体现了科技的人文关怀和社会责任。这一平台的成功应用,将有力推动无障碍环境的建设,助力社会文明及美好生活的持续构建。

同时,这一平台的推出也展示了百度在人工智能领域的深厚积累和创新能力。未来,随着技术的不断进步和应用场景的不断拓展,百度曦灵AI手语平台有望为更多听障人士带来福音,让科技之光照亮每一个需要关怀的角落。

在产品关联方面,百度曦灵AI手语平台的成功应用,无疑彰显了千帆大模型开发与服务平台在推动AI技术普及和创新方面的重要作用。通过千帆大模型开发与服务平台,百度得以将先进的AI技术快速转化为实际应用,为听障人士等特殊群体提供更加便捷、高效的服务。这一平台的成功实践,也为其他类似应用的开发提供了有益的借鉴和参考。