产品详情> 接口名称 产品规格 计费方式 有效期 限购一单 实名用户专享 45 元 原价元 立即抢购 确定 首购特惠 文档矫正增强 检测图片中的文件、卡证等内容四角点,进行矫正及效果增强。 产品详情> 接口名称 产品规格 计费方式 有效期 限购一单 实名用户专享 120 元 原价元 立即抢购 确定 首购特惠 文档去手写 去除图片中的手写内容,保留印刷体内容。
产品功能 嵌入水印 嵌入水印 无损嵌入水印信息至视频或图像,保持原媒体质量。 自定义水印配置 提供灵活的水印算法选择,以适应不同的隐蔽性和抗攻击性需求,包括嵌入方式、算法类型、算法强度等。 提取水印 提取水印 在多种二次处理的情况下仍能准确提取水印信息,实现有效的版权验证和内容追踪。 可视化界面 设计简洁直观,用户可对图片或视频进行一键操作,轻松展示或提取水印,使用便捷。
对文档图片进行方向矫正、效果增强、去摩尔纹、擦除手写文字等操作,还原清晰图像,提升图片采集及展示质量 了解详情 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括印刷 、手写、图片等多类数据 了解详情 办公文档识别 支持办公文档版面分析,精准识别图、表、印章等多元素位置及内容,支持多格式多语言识别场景 了解详情 iOCR通用版 针对固定版式的卡证票据可自主创建识别模板和分类器
端侧集成轻量化互动SDK,对音视频进行采集、处理与传输;云端深度整合全链路的ASR、LLM、TTS服务,支持FuctionCall自定义配置,通过AI降噪、人声分离、声纹提取、VAD检测、智能打断、智能抽帧等技术,对音视频进行增强处理,结合百度丰富的生态资源,提供百科、音乐、有声读物、翻译、导航等应用服务,为用户带来真人面对面的沉浸式沟通体验。
AI 作画 国内首个技术自研、基于大模型的通用且可控的文生图系统,可基于自然语言智能生成不限定风格的图像,面向有图片创作需求的开发者提供API调用服务,为内容创作者提供灵感和高质量配图 优惠 双12年终献礼,图像技术低至1折!
对文档图片进行方向矫正、效果增强、去摩尔纹、擦除手写文字等操作,还原清晰图像,提升图片采集及展示质量 通用场景文字识别 覆盖多种通用场景、多种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、数字、二维码等 办公文档识别 可对办公类文档的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持表格识别和印章识别 iOCR通用版 针对固定版式的卡证票据可自主创建识别模板和分类器
针对文档类场景提供多种图像处理能力,增强图片质量,搭配 OCR 提升识别效果 了解详情 iOCR全场景识别 针对任意版式的卡证票据进行自动分类和识别 了解详情 私有化部署方案 容器化打包,可部署至本地 CPU/GPU 服务器及国产化服务器,并可提供一体机方案 了解详情 离线识别 SDK 面向无网或弱网环境,提供可在手机、摄像头、执法记录仪等终端上集成的文字识别能力 了解详情 应用场景 远程身份认证
了解详情 智慧城管解决方案 提供多尺度的城市态势感知和多模事件精准识别处理服务,为城市管理增智赋能,提升城市管理水平,实现城市管理“像绣花一样精细”。 了解详情 智慧旅游解决方案 百度智慧旅游解决方案,充分发挥百度人工智能、地图、搜索、拟(增强)现实,数据、无人驾驶等核心能力,为文旅管理、服务和运营赋能。
数据处理 支持数据清洗、数据增强、数据生成,提升数据质量。 模型开发 全功能开发 提供Notebook建模、作业建模、可视化建模等模型训练方法;提供特征库,实现特征共享和复用。 零代码开发 提供EasyDL图像、文本、语音、视频、结构化数据、场景建模等工具。 大模型开发 提供专属大模型开发工具,支持SFT全量更新、LoRA、Post-pretrain等训练方法。
图像对比度增强 接口描述 调整过暗或者过亮图像的对比度,使图像更加鲜明。示意图如下: 在线调试 您可以在 示例代码中心 中调试该接口 ,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。