信号检测与图像重建技术  内容精选
  • 实时语音识别-websocket API - 语音技术

    实时语音识别-websocket API 接口描述 实时语音识别接口采用websocket协议的连接方式,边上传音频边获取识别结果。可以将音频流实时识别为文字,也可以上传音频文件进行识别;返回结果包含每句话的开始和结束时间,适用于长句语音输入、音视频字幕、直播质检、会议记录等场景。 WebSocket简介 WebSocket 是基于TCP的全双工协议,即建立连接后通讯双方都可以不断发送数据。 We

    查看更多>>

  • 图像审核 对象存储(BOS)

    API使用 开通图像审核功能后,您也可以通过调用 图像审核 API 进行图像主动审核,可很好的满足存量图像的审核需求。

    查看更多>>

信号检测与图像重建技术  更多内容
  • 语音识别 HarmonyOS SDK - 语音技术

    错误码映射 错误事件 鸿蒙错误码 对应安卓事件 安卓错误码 描述 ERROR_VAD_NO_SPEECH 1001 ERROR_AUDIO_VAD_NO_SPEECH 3101 没有检测到说话开始 ERROR_VAD_INIT_ERROR 1002 ERROR_AUDIO_VAD_INCORRECT 3100 VAD初始化失败 ERROR_NETWORK_FAIL_CONNECT 2001 ERROR_NETWORK_FAIL_CONNECT

    查看更多>>

  • 我们如何使用-Cookie-和同类技术 - 协议 | 百度智能云文档

    我们如何使用-Cookie-和同类技术 Cookie和匿名标识符工具。Cookie是支持服务器端(或者脚本)在客户端上存储和检索信息的一种机制。当您使用【百度智能云】产品或服务时,我们会向您的设备发送一个或多个Cookie或匿名标识符。当您与【百度智能云】服务进行交互时,我们允许Cookie或者匿名标识符发送给百度公司服务器。Cookie 通常包含标识符、站点名称以及一些号码和字符。

    查看更多>>

  • 相似图片搜索 - 图像搜索 | 百度智能云文档

    相似图片搜索 使用说明 在自建图库中找到与检索图片语义相似的图片集,并给出相似度打分(综合图片类型、颜色、内容、布局等特征) 典型应用场景:找相似的图片集合(返回的结果包含相同的图片),各种设计素材、美术作品、UGC内容等 适用的图片类型:各种网络图片、实拍图均可;注意 检索图和入库的原图要尽量保持场景一致性 ,比如入库的原图为标准的广告图(无背景干扰),则检索图要尽量避免背景、其他干扰特征,否则

    查看更多>>

  • 相同图片搜索 - 图像搜索 | 百度智能云文档

    相同图片搜索 使用说明 在自建库中搜索相同图片,仅返回完全相同或局部相同的图片结果。 典型应用场景:图片去重、图片精确查找,如图片类站点对海量库存图片进行查重过滤 适用的图片类型:各种网络图片、实拍图均可;注意 检索图和入库的原图要保持场景一致性 ,比如入库的原图为标准的广告图(无背景干扰),则检索图要尽量避免背景、其他干扰特征,否则模型计算图片的相似度时会有噪声,造成检索结果不准确。 举个例子:

    查看更多>>

  • 图像理解(精调后) - ModelBuilder

    图像理解(精调后) 本文介绍了经过SFT模型训练后发布的服务,调用相关API说明。 注意事项 (1)调用本文API前,需先经过SFT模型训练后发布服务,相关内容请参考 新手指南-平台使用快速开始 。 (2)适用以下经过SFT模型训练后发布的服务: LLaVA InternLM-XCompose InternVL2 接口描述 调用本接口,用于根据用户输入的图像和文字,回答图像有关问题。

    查看更多>>

  • EasyDL图像算力资源价格说明 - EasyDL零门槛AI开发平台 | 百度智能云文档

    批量预测 技术方向 计算设备 定价 EasyDL图像 CPU_4核_16G 0.025元/分钟/设备(2小时免费额度) EasyDL图像 TeslaGPU_P4_8G显存单卡_12核CPU_40G内存 0.28元/分钟/设备 EasyDL图像 TeslaGPU_P40_24G显存单卡_12核CPU_40G内存 0.36元/分钟/设备 EasyDL图像 TeslaGPU_V100_16G显存单卡_12

    查看更多>>

  • [AI行业案例]-语音技术助力罗湖区党建工作

    使用产品 长语音识别 语音唤醒 支持与交流 AI社区 教学视频 文档中心 SDK下载 语音技术助力罗湖区党建工作 价值成果 1、罗湖区政府党群服务中心报告厅、综合展厅,通过加设融合百度语音技术的魔屏智能显示设备,实现了重点语音发言可以实时转化、记录成可编辑的文本,展示在魔屏智能会议平板上,并可扫码保存。

    查看更多>>

  • 图像旋转 对象存储(BOS)

    图像旋转 概述 本文介绍图像旋转操作。 图像旋转参数 参数名称 缩写命令 类型 取值范围 命令描述 缺省值 是否必选 angle a int -360~360 指定图片旋转方式。 正数表示顺时针旋转,如 a_60 ; 负数表示逆时针旋转,如 a_-30 。 0 否 orientation o int 0,1,2 根据exif信息进行自动旋转。

    查看更多>>