图像识别

精准识别超过十万种物体和场景，包含10余项高精度的识图能力并提供相应的API服务，充分满足各类开发者和企业用户的应用需求

立即使用领取免费资源技术文档产品价格私有化部署

癌细胞病理图像的检测技术研究内容精选

[AI行业案例]-OCR技术助力钢铁物流实现智能管理
解决方案该物流平台通过使用百度通用文字识别技术，轻松实现了上述诉求，具体实现过程如下：步骤一：用户在该物流网内将钢材标签进行拍照上传，网站会先通过图像质量检测对图片质量进行分类，筛选出符合条件的图片；步骤二：系统再将这些图片进行分类，先对有固定版式的图片直接使用通用文字识别；步骤三：对于不是固定版式的图片将通过iOCR自定义模板文字识别+NLP文本矫正，对非标准文档进行结构化输出；步骤四：
查看更多>>
如何用可视化工具调用 - 语音技术
如何用可视化工具调用如何使用 Postman 调用语音技术服务 API 本文提供了通过可视化工具 Postman 调用短文本语音合成 API 的样例，帮助您零编码快速体验并熟悉语音技术服务。 1.
查看更多>>

癌细胞病理图像的检测技术研究更多内容

图像分割创建模型 - EasyDL零门槛AI开发平台 | 百度智能云文档
图像分割创建模型在导航【创建模型】中，选择任务场景，填写模型名称、联系方式、功能描述等信息，即可创建模型。其中任务场景分为实例分割和语义分割语义分割：图像分割指将每个像素点归属为对象类的过程。其中，语义分割适用于分割目标主体单一的场景，简单举例来说语义分割能够识别出图片中哪些像素是归属于“人”的标签，但无法区分“不同的人” 实例分割：图像分割指将每个像素点归属为对象类的过程。
查看更多>>
图像审核对象存储（BOS）
API使用开通图像审核功能后，您也可以通过调用图像审核 API 进行图像主动审核，可很好的满足存量图像的审核需求。
查看更多>>
实时语音识别-websocket API - 语音技术
实时语音识别-websocket API 接口描述实时语音识别接口采用websocket协议的连接方式，边上传音频边获取识别结果。可以将音频流实时识别为文字，也可以上传音频文件进行识别；返回结果包含每句话的开始和结束时间，适用于长句语音输入、音视频字幕、直播质检、会议记录等场景。 WebSocket简介 WebSocket 是基于TCP的全双工协议，即建立连接后通讯双方都可以不断发送数据。 We
查看更多>>
短语音识别REST-API-JavaSDK - 语音技术
短语音识别REST-API-JavaSDK 安装Speech Java SDK Speech Java SDK目录结构 com.baidu.aip ├── auth //签名相关类 ├── http //Http通信相关类 ├── client //公用类 ├── exception //exception类 ├── speech │ └── AipSpeech //AipSpeech类 └──
查看更多>>
呼叫中心语音-在线合成 - 语音技术
呼叫中心语音-在线合成接口描述及运行环境本文档是百度呼叫中心语音MRCP的用户指南。本程序做为MRCP Server端，集成了呼叫中心8K采样率语音识别(ASR)和呼叫中心专属发音人语音合成(TTS)两种能力，用户可分别单独使用某一种或同时使用。接入步骤参考接入指南，创建应用，获取AppID、API Key、Secret Key，用于后续配置使用点击呼叫中心语音解决方案Mrc
查看更多>>
短文本在线合成API - 语音技术
短文本在线合成API 接口描述百度短文本在线合成服务，基于HTTP请求的REST API接口，将文本转换为可以播放的音频文件。本文档描述了使用语音合成服务REST API的方法。在线调试&示例代码您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。 Demo 语音合成示例代码： https://github.com/Baid
查看更多>>
图像理解（精调后） - ModelBuilder
图像理解（精调后）本文介绍了经过SFT模型训练后发布的服务，调用相关API说明。注意事项（1）调用本文API前，需先经过SFT模型训练后发布服务，相关内容请参考新手指南-平台使用快速开始。（2）适用以下经过SFT模型训练后发布的服务： LLaVA InternLM-XCompose InternVL2 接口描述调用本接口，用于根据用户输入的图像和文字，回答图像有关问题。
查看更多>>
语音识别 HarmonyOS SDK - 语音技术
错误码映射错误事件鸿蒙错误码对应安卓事件安卓错误码描述 ERROR_VAD_NO_SPEECH 1001 ERROR_AUDIO_VAD_NO_SPEECH 3101 没有检测到说话开始 ERROR_VAD_INIT_ERROR 1002 ERROR_AUDIO_VAD_INCORRECT 3100 VAD初始化失败 ERROR_NETWORK_FAIL_CONNECT 2001 ERROR_NETWORK_FAIL_CONNECT
查看更多>>

图像识别

[AI行业案例]-OCR技术助力钢铁物流实现智能管理

如何用可视化工具调用 - 语音技术

图像分割创建模型 - EasyDL零门槛AI开发平台 | 百度智能云文档

图像审核对象存储（BOS）

实时语音识别-websocket API - 语音技术

短语音识别REST-API-JavaSDK - 语音技术

呼叫中心语音-在线合成 - 语音技术

短文本在线合成API - 语音技术

图像理解（精调后） - ModelBuilder

语音识别 HarmonyOS SDK - 语音技术

热门活动

新闻动态

最新活动

相关主题

热门产品

图像识别

[AI行业案例]-OCR技术助力钢铁物流实现智能管理

如何用可视化工具调用 - 语音技术

图像分割创建模型 - EasyDL零门槛AI开发平台 | 百度智能云文档

图像审核 对象存储（BOS）

实时语音识别-websocket API - 语音技术

短语音识别REST-API-JavaSDK - 语音技术

呼叫中心语音-在线合成 - 语音技术

短文本在线合成API - 语音技术

图像理解（精调后） - ModelBuilder

语音识别 HarmonyOS SDK - 语音技术

热门活动

新闻动态

最新活动

相关主题

热门产品

图像审核对象存储（BOS）