数据标注服务

适用于大规模的图像、视频、语音、文本以及其他特殊数据的数据清洗、评估、提取以及特殊信息标注,专业的标注团队高效、稳定提供数据标注服务。助力客户高效展开算法模型训练与机器学习,快速提高AI领域竞争力。
【山西标注基地】
政府共建标注基地确保数据安全和服务质量
详情>
【专题报道】
百度智能云数据众包,更专业的AI数据服务平台
详情>

产品概述

为客户提供专业的AI数据标注服务,凭借百度智能云10年的数据服务经验和标注基地丰富的标注人力,可准确、高效、安全地完成各类型数据标注任务,助力客户算法模型训练。

应用场景——计算机视觉

图像语义分割
图片/视频分类
图片框选
人脸骨骼打点
3D点云/2D3D融合标注
连续帧标注
  • 图像语义分割
  • 图像语义分割是基于区域的多边形标注,对复杂不规则的图片进行区域划分并标注对应属性,助力图像识别模型训练,多应用于人体分割、场景分割和自动驾驶道路分割,可应用于智能驾驶、智能设备、智能安防场景落地。
  • 标注能力:10W 区域/天
  •  
  • 图片分类
  • 基于百度标注基地人力可实现千万量级的图片清洗分类,依据您的需求可对您提供的图片集做属性归类,助力图像识别模型训练,可应用于智慧零售、智能设备、智能文娱等场景。
    
    标注能力:300W 图/天
  • 视频分类
  • 视频分类是通过观看视频片段对视频按主题进行分类,助力建立视频资料库,常用于视频行业的图像识别模型训练,可应用于智慧文娱场景的落地。
    
    标注能力:1W 段/天  
  • 图片框选
  • 图片框选可助力图像识别模型训练,用于框选图片中的识别主体目标,常见于对人脸、人体、障碍物、红绿灯的框选,可应用于智能驾驶、智能安防、智能设备的场景落地。
  • 标注能力:10W 框/天
  •  
  • 人脸骨骼打点
  • 人脸骨骼打点是基于点的标注,多应用于标注图片中人脸五官、人体骨骼关键点和汽车轮胎接地点,助力于图像识别模型训练,可应用于智能驾驶、智能设备、智能安防场景落地。
  • 标注能力:15W 图/天
  •  
  • 3D点云
  • 3D点云标注可助力自动驾驶模型的训练,百度基于自身丰富的自动驾驶标注经验和先进的标注工具,可对3D障碍物进行框选、对雷达图进行语义分割,帮助车辆更好的感知路面,可应用于自动驾驶场景的训练落地。
    
    框选能力:40W 框/天   分割能力:800帧/天
    
  • 2D3D融合标注
  • 2D3D融合标注可助力自动驾驶模型的训练,百度基于自身丰富的自动驾驶标注经验和先进的标注工具,可对2D3D多传感器融合的数据进行同时标注,帮助车辆实现视觉和雷达的感知,可应用于自动驾驶场景的训练落地。
    
    标注能力:10W 框/天
  • 连续帧标注
  • 连续帧标注常用于自动驾驶及视频图像识别模型的训练,通过对视频进行抽帧,并对每一帧图片中的目标物体进行连续标注,可应用于智能驾驶、智能安防、智能设备的场景落地。
  • 标注能力:25W 框/天
  •  

应用场景——语言识别

语音清洗
语音转写
语音切分
音素标注
  • 语音清洗
  • 语音清洗通过技术清洗空音频,并由人工进行监听,筛选出符合要求的音频,基于百度标注基地人力可实现海量音频清洗,助力语音识别模型训练,可应用于智能家居、智能设备、智能客服、智慧门店等场景落地。
  • 标注能力:300 小时/天
  •  
  • 语音转写
  • 语音转写是根据音频播放的内容转写为对应的文本,常用于语音识别模型训练,可支持普通话、方言、英文和小语种的语音转写,应用于智能家居、智能设备、智能客服、智慧门店等场景落地。
  • 标注能力:50 小时/天
  •  
  • 语音切分
  • 语音切分是对长音频进行监听,标注音频中说话人的起始点,用于语音识别模型训练,应用于智能家居、智能设备、智能客服、智慧门店等场景落地。
  • 标注能力:200 小时/天
  •  
  • 音素标注
  • 音素标注是对音频进行监听,转写文本同时对文字的音标进行标注,常用于语音合成技术。
  • 标注能力:5000 句/天
  •  

应用场景——自然语义

文本清洗
文本分类
文本富集
OCR转写
情感标注
NLP标注
  • 文本清洗
  • 文本清洗是按照您的的规则对文本进行筛选,挑出符合要求的数据,基于百度标注基地人力可实现千万级文本的清洗,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。
  • 标注能力:100W 条/天
  •  
  • 文本分类
  • 文本分类是按照您的的规则对文本进行属性分类,基于百度标注基地人力可实现百万级文本的分类操作,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。
  • 标注能力:20W 条/天
  •  
  • 文本富集
  • 文本富集是围绕主题进行文本撰写,使得对于同一主题,文本表达方式多样且贴合实际,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。
  • 标注能力:2W 条/天
  •  
  • OCR转写
  • OCR转写是对图片中的文字内容进行标框和转写,支持中文、英文及小语种的图片转写,助力图片和文本识别模型,可应用于智慧文娱、智能设备等场景。
  • 标注能力:20W 条/天
  •  
  • 情感标注
  • 情感标注是对文本表达情绪倾向进行判断,分类积极和消极的文本,可助力NLP模型训练,可应用于智能家居、智慧文娱、智慧金融等场景。
  • 标注能力:10W 条/天
  •  
  • NLP标注
  • NLP标注是对文本语法的标注,包括槽位提取、文本关系等,可助力NLP模型训练,可应用于智能家居、智慧文娱、智慧金融等场景。
  • 标注能力:5W 条/天
  •  

产品优势

经验丰富
10年行业和百度内部项目经验,可
高效完成各类标注任务
技术领先
业内最强的标注算法能力,充分提升
质量与产能
资源充足
业内最大的数据标注基地,具备充足
标注人力
标准严格
建立业内最严苛的安全/审核/作业流
程,保障安全和质量

山西数据标注基地

政企合作

与山西综合改革示范区管委会合建人工智能数据标注基地,2019年山西省重点推进项目,促进地区产业智能转型。

基地规模

全国最大规模专业数据标注基地,占地面积超1万平米,可容纳2500名专业标注员同时办公。

标注能力

全面支持无人驾驶、语音识别、人脸识别、地图数据等多种数据标注场景。

数据交付方式

支持数据公有化和私有化数据交付。 公有化交付:客户可在开放云直接提交需求或上传待处理数据,项目执行完毕后,下载结果数据,方便快捷项目实施; 私有化交付:我们将在您的公司内网部署数据客户端,您可以在公司内网批量提交需求并获取结果数据,数据隐私性更高。

案例实战

图片分类
人脸骨骼打点
图片框选
3D点云
语音标注
  • 花卉图片分类标注
  • 项目需求
    经过自动化初步分类的3,300,000张花卉照片进行进一步人工分类。
    
    标注成果
    22天完成3,380,796张图片分类标注工作,验收通过率100%。
  • 人脸照片打点标注
  • 项目需求
    300万张人脸照片分类、检测及定位标注,部分图需标出600余个定位点。
    
    标注成果
    27天完成300万的人脸照片打点标注,准确率99%以上,成本为外包公司的1/4。
  • 道路图片交通元素框选
  • 项目需求
    500,000+张道路图片进行内容实体标注。标注的实体为多种类型的交通元素,包括:小汽车、客车、大货车、面包车、行人、自行车、三轮车、摩托车、手推车等地面元素,并对图片中有遮挡或截断的元素进行属性标记。另需单独针对图片中的红绿灯进行标注且区分红绿灯属性(形状、颜色、方向等)。
    
    标注成果
    分批次交付,准确率99%,合作方肯定交付速度与质量。
  • 自动驾驶数据集标注
  • 项目需求
    3D点云数据标注,部分单帧图片中含有多达162辆交通工具或80名行人;同时需将路段对应的室外稠密点云数据按照19个分类进行精确分割标注。
    
    标注成果
    在20天内交付了22344帧图像语义标注与1.5km点云分割结果,工作效率是需求方自有标注人员的2倍,并陆续以高度的弹性与专业的快速反应能力应对了七次标注规则变更。
  • 语音数据转写与清洗
  • 项目需求
    对10,000条语音数据进行文本转义,并对语音录制质量进行分类清洗(清晰、有噪声、语音不完整等)。
    
    标注成果
    22天完成3,380,796张图片分类标注工作。3天内标注10,000条语音数据,通过率100%。

合作伙伴

  

相关推荐

数据采集

适用于各种复杂场景数据采集的需求
查看详情>

数据采集与标注通用解决方案

为客户提供专业、高质量的AI数据服务
查看详情>

一体化智能驾驶数据解决方案

提供一整套智能驾驶数据服务,打造数据驱动闭环
查看详情>

定制服务

专业AI数据助力企业智能领域发展