概述
更新时间:2019-06-14
概述
FPGA具有低功耗,低延时,高性能的特点,在深度学习计算领域有很广阔的应用前景。FPGA从2013年开始就应用在许多典型的深度学习模型中,如DNN,RNN,CNN,LSTM等,涵盖了语音识别,自然语言处理,推荐算法,图像识别等广泛的应用领域。
FPGA云服务器提供了基于FPGA的深度卷积神经网络加速服务,单卡提供约3TOPs的定点计算能力,支持典型深度卷积网络算子,如卷积、逆卷积、池化、拼接、切割等。有效加速典型网络结构如VggNet、GoogLeNet、ResNet等。
我们基于FPGA的深度学习硬件,定制优化了主流深度学习平台,如caffe等,您可以直接将深度学习业务切换到FPGA平台,而无需考虑底层硬件细节。
通过使用预先训练好的ResNet-50进行图像分类性能的对比测试,在CPU、GPU和FPGA三类设备的物理机上的测试结果如下:
其中:
- CPU为Intel Xeon CPU E5-2650 v3,使用OpenBLAS占用4核进行测试
- GPU为Nvidia Tesla K40m
测试结果可以明显看到FPGA在时延上跟GPU差不多,比CPU快了超过12倍,在吞吐上FPGA更是比GPU超出1.5倍和比CPU超出近7倍。