百度智能云

百度智能云、百度公有云、百度应用引擎BAE、云服务器、云主机、云数据库、CDN、云存储、云磁盘、Mapreduce、大数据分析 百度智能云、百度公有云、百度应用引擎BAE、云服务器、云主机、云数据库、CDN、云存储、云磁盘、Mapreduce、大数据分析
适用于大规模的图像、视频、语音、文本以及其他特殊数据的数据清洗、评估、提取以及特殊信息标注,专业的标注团队高效、稳定提供数据标注服务,结合高质量的内容审核解决方案服务,助力客户高效展开算法模型训练与机器学习,快速提高AI领域竞争力。
数据标注服务& 内容审核服务

了解我们

产品概述

为客户提供专业的AI数据标注服务,凭借百度智能云10年的数据服务经验和标注基地丰富的标注人力,可准确、高效、安全地完成各类型数据标注任务,助力客户算法模型训练。

产品概述

应用场景——计算机视觉

图像语义分割
图片/视频分类
图片框选
人脸骨骼打点
3D点云/2D3D融合标注
连续帧标注
图像语义分割
  • 图像语义分割

    图像语义分割是基于区域的多边形标注,对复杂不规则的图片进行区域划分并标注对应属性,助力图像识别模型训练,多应用于人体分割、场景分割和自动驾驶道路分割,可应用于智能驾驶、智能设备、智能安防场景落地。
  • 标注能力:10W 区域/天

     
图片/视频分类
  • 图片分类

    基于百度标注基地人力可实现千万量级的图片清洗分类,依据您的需求可对您提供的图片集做属性归类,助力图像识别模型训练,可应用于智慧零售、智能设备、智能文娱等场景。
    
    标注能力:300W 图/天
  • 视频分类

    视频分类是通过观看视频片段对视频按主题进行分类,助力建立视频资料库,常用于视频行业的图像识别模型训练,可应用于智慧文娱场景的落地。
    
    标注能力:1W 段/天  
图片框选
  • 图片框选

    图片框选可助力图像识别模型训练,用于框选图片中的识别主体目标,常见于对人脸、人体、障碍物、红绿灯的框选,可应用于智能驾驶、智能安防、智能设备的场景落地。
  • 标注能力:10W 框/天

     
人脸骨骼打点
  • 人脸骨骼打点

    人脸骨骼打点是基于点的标注,多应用于标注图片中人脸五官、人体骨骼关键点和汽车轮胎接地点,助力于图像识别模型训练,可应用于智能驾驶、智能设备、智能安防场景落地。
  • 标注能力:15W 图/天

     
3D点云/2D3D融合标注
  • 3D点云

    3D点云标注可助力自动驾驶模型的训练,百度基于自身丰富的自动驾驶标注经验和先进的标注工具,可对3D障碍物进行框选、对雷达图进行语义分割,帮助车辆更好的感知路面,可应用于自动驾驶场景的训练落地。
    
    框选能力:40W 框/天   分割能力:800帧/天
    
  • 2D3D融合标注

    2D3D融合标注可助力自动驾驶模型的训练,百度基于自身丰富的自动驾驶标注经验和先进的标注工具,可对2D3D多传感器融合的数据进行同时标注,帮助车辆实现视觉和雷达的感知,可应用于自动驾驶场景的训练落地。
    
    标注能力:10W 框/天
连续帧标注
  • 连续帧标注

    连续帧标注常用于自动驾驶及视频图像识别模型的训练,通过对视频进行抽帧,并对每一帧图片中的目标物体进行连续标注,可应用于智能驾驶、智能安防、智能设备的场景落地。
  • 标注能力:25W 框/天

     

应用场景——语言识别

语音清洗
语音转写
语音切分
音素标注
语音清洗
  • 语音清洗

    语音清洗通过技术清洗空音频,并由人工进行监听,筛选出符合要求的音频,基于百度标注基地人力可实现海量音频清洗,助力语音识别模型训练,可应用于智能家居、智能设备、智能客服、智慧门店等场景落地。
  • 标注能力:300 小时/天

     
语音转写
  • 语音转写

    语音转写是根据音频播放的内容转写为对应的文本,常用于语音识别模型训练,可支持普通话、方言、英文和小语种的语音转写,应用于智能家居、智能设备、智能客服、智慧门店等场景落地。
  • 标注能力:50 小时/天

     
语音切分
  • 语音切分

    语音切分是对长音频进行监听,标注音频中说话人的起始点,用于语音识别模型训练,应用于智能家居、智能设备、智能客服、智慧门店等场景落地。
  • 标注能力:200 小时/天

     
音素标注
  • 音素标注

    音素标注是对音频进行监听,转写文本同时对文字的音标进行标注,常用于语音合成技术。
  • 标注能力:5000 句/天

     

应用场景——自然语义

文本清洗
文本分类
文本富集
OCR转写
情感标注
NLP标注
文本清洗
  • 文本清洗

    文本清洗是按照您的的规则对文本进行筛选,挑出符合要求的数据,基于百度标注基地人力可实现千万级文本的清洗,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。
  • 标注能力:100W 条/天

     
文本分类
  • 文本分类

    文本分类是按照您的的规则对文本进行属性分类,基于百度标注基地人力可实现百万级文本的分类操作,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。
  • 标注能力:20W 条/天

     
文本富集
  • 文本富集

    文本富集是围绕主题进行文本撰写,使得对于同一主题,文本表达方式多样且贴合实际,助力NLP模型训练,可应用于智能客服、智慧金融、智能驾驶等场景。
  • 标注能力:2W 条/天

     
OCR转写
  • OCR转写

    OCR转写是对图片中的文字内容进行标框和转写,支持中文、英文及小语种的图片转写,助力图片和文本识别模型,可应用于智慧文娱、智能设备等场景。
  • 标注能力:20W 条/天

     
情感标注
  • 情感标注

    情感标注是对文本表达情绪倾向进行判断,分类积极和消极的文本,可助力NLP模型训练,可应用于智能家居、智慧文娱、智慧金融等场景。
  • 标注能力:10W 条/天

     
NLP标注
  • NLP标注

    NLP标注是对文本语法的标注,包括槽位提取、文本关系等,可助力NLP模型训练,可应用于智能家居、智慧文娱、智慧金融等场景。
  • 标注能力:5W 条/天

     

应用场景——内容审核

问答评论
昵称签名
日记帖子
恶意推广
图文图集
音视频弹幕
问答评论
  • 问答评论

    对文本中的色情行为描述、色情资源链接、低俗交友、污秽文案等内容进行审核。
  • 审核能力:3680W 条/天

     
昵称签名
  • 昵称签名

    针对用户的昵称及签名进行审核,抽质拦截违规昵称签名。
  • 审核能力:1.5W 条/天

     
日记帖子
  • 日记帖子

    对医美等细分垂类业务中用户发的帖子、日记等长篇文本内容进行审核。
  • 审核能力:100W 条/天

     
恶意推广
  • 恶意推广

    对文本中带有售卖意向的软文广告,微信、QQ等个人联系方式等违规内容及变体进行审核。
  • 审核能力:1W 条/天

     
图文图集
  • 图文图集

    主要针对网页及客户端用户付的UGC/PGC等内容进行审核、抽质拦截违规事件。
  • 审核能力:100W 条/天

     
音视频弹幕
  • 音视频弹幕

    对客户端接口等发布的音频、视频数据,转成文本格式进行音频内容,弹幕内容进行审核
  • 审核能力:音视频1.6Wh/天 弹幕4575万条/天

     

产品优势

经验丰富
经验丰富
10年行业和百度内部项目经验,可
高效完成各类标注任务
技术领先
技术领先
业内最强的标注算法能力,充分提升
质量与产能
资源充足
资源充足
业内最大的数据标注基地,具备充足
标注人力
标准严格
标准严格
建立业内最严苛的安全/审核/作业流
程,保障安全和质量

山西数据标注基地

  • 政企合作

    与山西综合改革示范区管委会合建人工智能数据标注基地,2019年山西省重点推进项目,促进地区产业智能转型。
  • 基地规模

    全国最大规模专业数据标注基地,占地面积超1万平米,可容纳2500名专业标注员同时办公。
  • 标注能力

    全面支持无人驾驶、语音识别、人脸识别、地图数据等多种数据标注场景。

数据交付方式

根据客户需求,支持公有化、私有化两种数据交付方式。

数据交付方式
  • 公有化交付

    客户可直接在开放云提交需求或者上传待处理数据,项目执行完毕后,下载结果数据,交付过程方便快捷。

  • 私有化交付

    根据需求,在客户公司内网部署数据客户端,客户可通过公司内网批量提交需求并获取结果数据,数据隐私性更高、安全性更强。

案例实战

图片分类
人脸骨骼打点
图片框选
3D点云
语音标注
内容审核
图片分类
  • 花卉图片分类标注

    项目需求
    经过自动化初步分类的3,300,000张花卉照片进行进一步人工分类。
    
    标注成果
    22天完成3,380,796张图片分类标注工作,验收通过率100%。
人脸骨骼打点
  • 人脸照片打点标注

    项目需求
    300万张人脸照片分类、检测及定位标注,部分图需标出600余个定位点。
    
    标注成果
    27天完成300万的人脸照片打点标注,准确率99%以上,成本为外包公司的1/4。
图片框选
  • 道路图片交通元素框选

    项目需求
    500,000+张道路图片进行内容实体标注。标注的实体为多种类型的交通元素,包括:小汽车、客车、大货车、面包车、行人、自行车、三轮车、摩托车、手推车等地面元素,并对图片中有遮挡或截断的元素进行属性标记。另需单独针对图片中的红绿灯进行标注且区分红绿灯属性(形状、颜色、方向等)。
    
    标注成果
    分批次交付,准确率99%,合作方肯定交付速度与质量。
3D点云
  • 自动驾驶数据集标注

    项目需求
    3D点云数据标注,部分单帧图片中含有多达162辆交通工具或80名行人;同时需将路段对应的室外稠密点云数据按照19个分类进行精确分割标注。
    
    标注成果
    在20天内交付了22344帧图像语义标注与1.5km点云分割结果,工作效率是需求方自有标注人员的2倍,并陆续以高度的弹性与专业的快速反应能力应对了七次标注规则变更。
语音标注
  • 语音数据转写与清洗

    项目需求
    对10,000条语音数据进行文本转义,并对语音录制质量进行分类清洗(清晰、有噪声、语音不完整等)。
    
    标注成果
    22天完成3,380,796张图片分类标注工作。3天内标注10,000条语音数据,通过率100%。
内容审核
  • 音频及评论审核任务

    项目需求
    对用户信息、评论,直播音视频、歌曲、弹幕等进行标注审核保证实时性,平均时间<10分钟。
    
    标注成果
    快速接入合作项目,3天内完成标注审核队伍搭建和人员培训;
    保证10分钟实时性要求,无延期事故;
    零安全事故 按时按量完成审核任务,召回率100%

合作伙伴

合作伙伴

相关推荐

数据采集
数据采集

适用于各种复杂场景数据采集的需求

数据采集与标注通用解决方案
数据采集与标注通用解决方案

为客户提供专业、高质量的AI数据服务

一体化智能驾驶数据解决方案
一体化智能驾驶数据解决方案

提供一整套智能驾驶数据服务,打造数据驱动闭环

定制服务

专业AI数据助力企业智能领域发展

未登录
需要实名认证
去实名认证