FPGA云服务器

FPGA Cloud Compute

配备现场可编程门阵列(Field Programmable Gate Array)的高性能云计算服务。同时具备开发、模拟、调试和编译硬件代码所需的各种资源,您可以基于FPGA云服务器为您的应用程序创建自定义的硬件加速能力。

产品概述

FPGA云服务器是云环境中配备FPGA的计算实例,通过购买FPGA实例,您可以结合自身业务场景,利用百度云提供的完善的FPGA加速平台,以及配套的开发、模拟、调试、编译资源,快速地为您的业务构建专属的FPGA硬件加速程序;您也可以从百度云直接获取已设计好的、适配您业务的FPGA加速实例,为您有加速需求的业务选择高性能低成本的解决方案。

百度有将近9年FPGA加速器研发和大规模部署的经验,技术处于世界领先水平。百度在FPGA加速领域的论文发表在ASPLOS 2014(国内第二篇,并获最佳论文提名),EUROSYS2014,Hotchips 2014/2016/2017等顶级国际会议。FPGA云服务器会大量复用百度内部先进及成熟的技术,您只需要关注自己的业务功能逻辑,即可快速开发出高性能的专属FPGA硬件加速程序。百度也将开放百度内部的FPGA加速IP及服务,同时会建立第三方云市场,帮助您更快,更好搭建自己的FPGA应用。

产品功能

专用FPGA及硬件板卡

每个FPGA实例独享一个FPGA加速平台,不会在实例、用户之间共享。搭载20nm XILINX XCKU115 FPGA芯片,包含150万个逻辑单元,5520个DSP

开发工具包

百度云提供完整的FPGA软硬件开发环境,并提供丰富的软硬件代码示例,帮助您实现快速的开发和迁移

FPGA加速实例

百度云提供功能丰富的高性能FPGA加速实例,如深度学习加速实例、加解密实例等,帮助您降低开发成本和开发周期,加速业务部署

安全监控

实时监控硬件资源使用量、等待队列的平均长度和硬件温度情况,帮助用户了解硬件使用情况,应对突发情况降低风险

产品优势

快速
部署

• 您只需几分钟时间即可在控制台快速购买一台或多台FPGA实例
• 您可以在同一FPGA实例上更换不同的应用环境,从而便于测试和运行多个硬件加速
• 直接在控制台管理FPGA实例即可,不需要关注FPGA硬件设施,百度云会维护硬件设备的稳定运行
• 百度云提供丰富的专用加速实例,提供镜像和配套软件组件,无需了解FPGA开发也可以享受到FPGA硬件强大的加速效果
• 百度云FPGA也将支持Intel FPGA平台,方便客户选择需要的开发环境

功能
强大

• 百度自研FPGA加速卡,提供业界最多内存通道,最高内存带宽,与仅使用CPU的服务器相比,适用FPGA的应用程序可以有高达100倍的提速
• 大量复用百度多年积累的先进,成熟技术,如Library,驱动,API,PCIE-DMA,DDR4控制器及其他静态逻辑,方便您快速搭建高性能的专属FPGA加速程序
• 百度自研FPGA加速卡,已经在百度数据中心大规模部署,并且长时间稳定运行。能提供稳定,可靠,高质量的FPGA云服务器
• 百度在AI,大数据处理,基因,RSA2048加解密等领域有深厚的积累,以IP或服务的形式提供给用户使用。您可以基于百度的FPGA服务或IP开发自己的应用,帮助     您的应用加速性能达到业界最好水平

节约
成本

• FPGA实例支持按使用量付费,同时也支持包年包月购买,用户可灵活选择,节省成本投入
• 无需采购或设计FPGA板卡,节省硬件平台的成本与时间
• 无需购买高性能主机和FPGA工具,节省开发环境成本投入
• 利用百度成熟及先进的FPGA技术积累,大大缩短FPGA部署和开发时间,节省时间和人力成本

灵活
易用

• 百度将提供功能完善的静态逻辑及软件参考设计,您只需要实现自身业务逻辑的FPGA实现
• FPGA实例采用透传技术,将FPGA通过PCI-e结构链接到实例中,确保FPGA性能稳定可预期
• 与云主机BCC、负载均衡BLB、对象存储BOS等云产品无缝连接,方便业务在云上部署
• 与云主机BCC采取相同的管理方式,便于管理

应用场景

无论是学术界还是工业界,越来越多的研究者都在探索FPGA在深度学习领域的应用场景,尤其是Inference。

在百度内部,FPGA从2013年开始就应用在许多典型的深度学习模型中,如DNN,RNN,CNN,LSTM等,涵盖了语音识别,自然语言处理,推荐算法,图像识别等广泛的应用领域。

百度FPGA云服务器中开放了基于FPGA的深度卷积神经网络加速服务,单卡提供3Tops的定点计算能力,支持典型深度卷积网络算子,如卷积、逆卷积、池化、拼接、切割等,有效加速典型网络结构如VggNet、GoogLeNet、ResNet等。我们基于FPGA的深度学习硬件,深度定制优化了主流深度学习平台如caffe等,用户可以直接将深度学习业务切换到FPGA平台,而无需考虑底层硬件细节。

RSA算法是一种最广为使用的“非对称加密算法”,一般公钥/私钥长度越长,安全性就越好,计算也越复杂。百度https改造中应用了RSA 2048加解密算法,针对高计算复杂度的RSA解密任务,我们运用FPGA上的并行计算资源和定制化的数据通路,提供了高达45000QPS的解密能力(是CPU单线程吞吐率的75倍以上,媲美商用ASIC加解密卡的吞吐率),同时提供了独具特色的私钥管理方案,令系统安全性得到了质的提升(该功能暂不开放)。

在生物信息分析领域,我们的FPGA加速方案,可以使基因序列比对任务的耗时,从数个小时缩短至几分钟。这为高通量、低成本和高准确率地测序一个人的完整基因提供了有力的工具。

我们实现的Blast算法,可以在FPGA中同时处理多条基因的比对任务,运行效率相当于39个CPU核。