在众多服务商中,选择与百度智能云数据众包合作主要看重百度智能云在这方面的数据经验和产品技术能力,以及其提供的数据标注安全方案能够很好地满足我们的需求。
——上海国际汽车城副总工程师李霖
上海国际汽车城是上海市政府“十五”计划中的重点建设项目。作为西部的综合性汽车产业基地, 它将与东部的微电子产业基地、南部的石油化工基地、北部的精品钢铁基地共同构成上海“东南西北”四大产业基地。
作为全国最早开展智能网联汽车示范推广的产业示范区,其规划从感知和决策层入手,打造硬件、软件、数据、路测整体解决方案。而这其中决策层是最关键也是最复杂的,算法训练需要一系列配套建设,包括数据层面的训练数据和场景库评测数据,以及软件层面深度学习数据标注平台和管理训练平台。但由于自动驾驶数据精度高、量级大、标注规则复杂,且软件平台具有业务场景适用性特征,研发难度高,业内往往会选择专业的AI数据公司提供数据和平台服务。
如何基于业务特征提供平台能力建设,同时保证数据标注质量和安全,实现自动驾驶超智“双眼”已成为汽车城乃至整个自动驾驶行业的难题。
针对上海国际汽车城需求,百度智能云数据众包推出了“私有化标注平台+基地专属团队”方案,结合国际汽车城的自动驾驶标注场景和组织管理需求做定制化开发,将百度领先的标注平台能力抽取并做私有化部署。
其中,百度智能云数据众包“私有化标注平台”支持2D、3D、连续帧、融合标注等数十个标注场景,引入了AI预标注和自动质检算法。经百度上万项目科学验证,在标注效率上领先行业20%,并且还具备全面的任务、数据、标注人员管理功能,有效支撑企业做标注管理。同时,由于平台具有私有化特征,可以实现数据不出库从而保证数据安全。
在“基地专属团队”上,百度与山西政府合建了业内最大的数据标注基地,拥有超过2000名经过多年专业培训的标注员。基地按照百度数据安全等级规定采取了保密协议签署、密闭房间作业、实时摄像监控、USB封口等多种严格的安全控制措施,从人的源头上保证数据安全,同时能够做到高质量和高效率交付。
对此,百度智能云数据众包业务负责人施佳樑介绍:“数据安全一直是我们关注的,也是整个AI行业发展的共同课题,我们从很早开始就在内部建立了严苛的安全机制,确保客户数据安全。”
深度学习标注平台的部署增强了国际汽车城的软件设施能力,“平台部署+基地标注”的模式在保证数据安全的同时,也极大提升了汽车城的数据处理能力。大量基于自动驾驶场景的高质量数据源源不断地从百度山西标注基地输出,并依托汽车城平台支撑着行业算法的成熟。
同时,百度智能云数据众包也在不断对外开放自己的自动驾驶数据采集和标注能力,根据行业需求打造基于数据标注、存储、管理、训练、清洗、评测的全套产品能力。并先后与多个地方政府在人工智能数据层面开展深入合作,助力地方产业的转型升级。