EasyDL自定义图像审核 通过EasyDL平台定制图像分类、物体检测等模型,自定义识别标签,满足定制化审核需求 应用场景 视频直播图像审核 社交应用图像审核 社区论坛图像审核 实名社交头像审核 视频直播图像审核 采用百度色情识别、图文审核等技术,对视频、直播的截帧图像进行实时自动审核,快速高效,过滤违规内容的同时保证良好的用户体验 合作案例 特色优势 识别准确率高 依托百度的海量数据积累和领先的视觉技术
通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、印章、数字、二维码等;可用于纸质文档电子化、办公文档/报表识别、图像内容审核、快递面单识别等场景。
可生成不同风格、不同构图、不同流派的图片,满足个性化的图片生成需求 支持参考图作画 AI作画-高级版支持输入参考图片进行风格迁移,支持更丰富的风格和流派,作画质量更高更精美 应用场景 图片素材 艺术插图 海报制作 故事插图 壁纸制作 电商应用 室内设计 影视制作 游戏原画设计 服务创意启发平台 图片素材 通过生成人物形象、物品或场景,为从业者提供参考素材,对生成的内容进行二次创作等 合作案例 技术特色 知识增强扩散模型
基于百度跨模态大模型能力,仅提供少量的【图片样本】+【基础提示词】,便能有效覆盖通用审核模型难以识别的场景,增强个性化场景的审核能力 图像内容安全 准确识别图片中的色情、广告、恶心、违禁等不良内容,也能从美观和清晰等维度对图像进行筛选,支持自定义图像黑白名单库,全面过滤违规、低质图像 文本内容安全 精准高效识别色情、违禁、广告、辱骂、灌水等文本,具备对拼音、谐音、拆字等变体识别能力。
1个或多个物体的名称,并可获取识别结果对应的百科信息 图像增强与特效 基于领先的深度学习技术,对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 图像主体检测 检测出图片主体的坐标位置,可使用该接口裁剪出图像主体区域,配合图像识别接口提升识别精度
将图像转换成卡通画或素描风格,可用于开展趣味活动或集成到美图应用 图像修复 支持去除图片中不需要的遮挡物,使用背景内容进行填充;修复图片缺损内容 图像清晰度增强 对压缩后的模糊图像实现智能快速去噪,优化图像纹理细节,使画面更加自然清晰
并支持获取识别结果对应的百科信息 植物识别 识别超过2万种通用植物和近8千种花卉,接口返回植物的名称,并获取百科信息,适用于拍照识图类APP中 图像主体检测 检测图片中的主体,支持单主体检测、多主体检测,可识别出图片中主体的位置和标签 图像增强与特效 对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像 图像搜索 以图搜图,在指定图库中搜索出相同或相似的图片,适用于图片精确查找
球员表现 数据分析 球员基础数据统计 支持进球、射门、定位球、控球等相关数据统计。 球队进阶数据分析 支持触球总数、攻防转换总数、向前传球总数等相关统计。 产品优势 领先 AI 算法,专业级保障 智能裁切画面局部,实现精彩的人球追踪直播效果。覆盖足篮排、飞盘、冰球、棒球等多类体育运动。 低门槛,易接入 标准云服务,简单配置,即可随时随地开播。
噪声检测 检测视频图像中混有呈带状、波纹、网状等带有周期性的叠加噪声的片段。 块效应/场效应检测 检测视频随着码率的降低,在块的边界会出现不连续、形成重建图像的明显缺陷的片段。 检测视频后期处理阶段由于压缩导致图像运动处出现交错行的片段。 音量检测 检测音频出现超出人耳舒适范围的音量过高/过低的片段。 检测由于录制过程中信号源输入不稳定导致音频断断续续的片段。
对文档图片进行方向矫正、效果增强、去摩尔纹、擦除手写文字等操作,还原清晰图像,提升图片采集及展示质量 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等 办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持表格识别和印章识别 iOCR通用版 针对固定版式的卡证票据可自主创建识别模板和分类器