p2p音视频通信 开源 sdk  内容精选
  • 实时视频RTC_实时视频处理与传输服务

    实时视频SDK接入百度智能云全球低延迟实时通信网,为开发者提供低延迟、高可靠的全球低延迟视频通信服务,同时开发者可基于控制台实时查看通信质量。 配合百度智能云对象存储 BOS、视频直播 LSS 可快速实现视频通话的录制和直播分发。

    查看更多>>

  • 语音合成定制库_定制库技术-百度AI开放平台

    最高支持10万字文本一次性合成,提供多种优质库选择,广泛应用于阅读听书、新闻播报等场景 零门槛AI开发自助平台 零基础即可自助训练完成AI开发,涵盖图像、文本、语音、视频等多种场景,最快15分钟完成

    查看更多>>

p2p音视频通信 开源 sdk  更多内容
  • 播放器SDK_直播拉流_视频直播_视频点播

    视频直播 LSS 提供稳定流畅、低延迟、支持高并发的一站式智能直播云服务。 移动直播 SDK 提供稳定流畅、高可靠、高并发的直播推流服务,支持实时美颜滤镜、AR特效。

    查看更多>>

  • 文字识别离线SDK_文字识别SDK_OCR SDK-百度AI开放平台

    体验流畅 UI自定义修改 SDK内部所有UI层代码全部开源,可根据实际业务需求自定义界面样式,灵活应用 授权方式多样 支持单台硬件授权,单独激活使用,也可按批量设备授权,并结合实际业务场景选择更具性价比的授权方案 即刻体验文字识别离线SDK 申请即可获得30天免费试用权限 立即使用 相关推荐 文字识别私有化部署方案 可部署至「本地服务器」或「专有云服务器」的文字识别服务,支持通用场景、卡证、票据、

    查看更多>>

  • 移动直播SDK

    视频SDK视频SDK是智能视频SDK的短视频场景化产品,集成了拍摄、AR特效、剪辑、拼接、播放、音乐、双语字幕等功能的客户端SDK视频创作分发平台 视频创作分发平台以媒资管理+工作流处理为核心,提供端到端一站式解决方案,包括:视频采集上传、安全存储、灵活管理、智能处理等。

    查看更多>>

  • 视频直播LSS_直播解决方案

    开发者指南 API参考须知 推流端SDK介绍 服务端SDK介绍 播放器SDK介绍 相关产品 视频创作分发平台VideoWorks 一站式点播云服务,让视频技术零门槛。

    查看更多>>

  • 人脸离线采集SDK_人脸采集SDK

    动作活体检测 实时反馈眼睛、嘴巴、头部姿态等状态,通过完成指定动作,判断用户是否为活体,支持指定动作及顺序 人脸图片采集 在人脸检测及追踪过程中,完成人脸图片采集,并输出预设条件的人脸图片 人脸检测 手机端离线实时监测视频流中的人脸,同时支持处理静态图片或者视频流 人脸跟踪 对当前检测到的人脸持续跟踪,动态定位人脸轮廓,稳定贴合人脸 人脸关键点 对当前检测到的人脸持续跟踪,并动态实时展现人脸上的核心关键点

    查看更多>>

  • 人脸离线识别SDK_人脸识别离线SDK-百度AI开放平台

    在设备端离线状态下实时监测视频流中的人脸,同时支持处理静态图片或者视频流,并对当前检测到的人脸持续跟踪,动态定位人脸轮廓,稳定贴合人脸。

    查看更多>>

  • 视频处理_视频转码_实时转码

    服务 快速使用视频处理MCP 操作指南 视频处理MCP操作指南概述 在对象存储BOS中完成视频上传与存储 创建队列、创建转码任务等相关操作 创建缩略图任务、查看任务详情等相关操作 产品实践 如何通过API接口求创建任务队列 如何通过服务端SDK创建任务队列等任务 如何通过视频转码的方式给原始视频添加字幕 如何通过加密算法对视频文件进行加密 相关产品 对象存储BOS 海量空间、高安全、高可靠,支撑了国内最大网盘的云存储

    查看更多>>

  • 语音字幕服务_语音识别字幕服务-百度AI开放平台

    gt; 立即使用 技术文档 产品价格 功能介绍 功能演示 应用场景 特色优势 产品定价 相关推荐 功能介绍 音频内容转文字 将视频语音内容实时或异步精准识别为文字,助力字幕生产降本增效 多种调用方式 支持传入pcm、wav等格式音频流和音频文件,支持API、SDK调用及多种参数调整 自动匹配时间戳 识别结果智能分句,返回句子开始和结束时间,准确匹配时间戳,便于字幕文本对齐视频进度 字幕文本润色

    查看更多>>