清华大学

清华大学是中华人民共和国教育部直属的全国重点大学,位列国家“双一流”A类、“985工程”、“211工程”,入选“2011计划”、“珠峰计划”、“强基计划”、“111计划”,为九校联盟、松联盟、中国大学校长联谊会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员、中国高层次人才培养和科学技术研究的基地,被誉为“红色工程师的摇篮”。

客户收益

百度智能云数据众包与清华大学开展项目合作,推进全球首个十亿像素级视频数据集 PANDA 的建设工作,用以支持未来在公共安全、智慧城市、虚拟现实等领域的各项研究及应用。

使用产品

业务背景

近日,百度智能云数据众包与清华大学开展项目合作,推进全球首个十亿像素级视频数据集 PANDA 的建设工作,用以支持未来在公共安全、智慧城市、虚拟现实等领域的各项研究及应用。

本次项目共完成7200余帧亿级像素图片,共计超过106万张切图的数据标注工作,包括物体间关系近2万组、交互行为近20万个、移动物体轨迹点近30万组,以及数十亿 3D 点云数据的语义分割及实例标注,极大地丰富了 PANDA 现有数据集,并为清华大学后续举办的 GigaVision(十亿像素级机器视觉)主题挑战赛提供数据支持。

解决方案

近年来,行人检测、轨迹跟踪、动作识别、异常检测、属性识别等计算机视觉分析,已广泛运用到无人驾驶、智能安防、智慧城市等多个领域。AI 算法应用的背后,离不开大批量、高质量的标注数据。百度数据众包作为国内最大的 AI 数据服务提供商,具备数据“采、标、存、管、训”一体化的服务能力,专注于为人工智能的发展与应用赋能。

据了解,PANDA 是全球首个十亿像素级视频数据平台,它突破了人眼视觉分辨率的极限,赋予视觉计算更高质、更真实、更全面的源数据,填补了国际上“宽视场、多对象、高分辨率”数据平台的空白,为新一代智能处理技术研究提供了不可或缺的数据基础。

主流图像及视频数据集对比

清华大学电子工程系副教授、PANDA 数据集项目负责人方璐介绍,此前清华大学团队曾围绕 PANDA 数据集,在计算机视觉顶级国际会议 ECCV 2020上,组织了 GigaVision 2020挑战赛并引起广泛关注。目前,团队正在筹办 ACMMM 2021会议的 GigaVision 主题挑战赛,以及全球人工智能技术创新大赛的相关赛道。

研究现实世界中大规模人群的复杂行为及交互方式,对于人工智能系统更好地理解人的行为与意图,进而提升智能决策能力有着重要意义。PANDA 数据平台的构建,使得对于大场景、多对象、复杂关系的建模与分析成为可能。未来,百度将持续与清华大学合作,以技术赋能,推进 PANDA 数据平台的建设与发展。

百度作为国内人工智能领军企业,也是中国唯一在智能交互、智能基础设施和产业智能化领域,都形成了优势的 AI 平台型公司。依托百度多年 AI 数据经验,百度数据众包专注以数据智能对外赋能,致力于提供优质数据服务,携手政府、企业、高校等更多合作伙伴,共同推进新一代人工智能的高质量发展。