CNN图像分类服务

概述

FPGA具有低功耗,低延时,高性能的特点,在深度学习计算领域有很广阔的应用前景。FPGA从2013年开始就应用在许多典型的深度学习模型中,如DNN,RNN,CNN,LSTM等,涵盖了语音识别,自然语言处理,推荐算法,图像识别等广泛的应用领域。

FPGA云服务器提供了基于FPGA的深度卷积神经网络加速服务,单卡提供约3TOPs的定点计算能力,支持典型深度卷积网络算子,如卷积、逆卷积、池化、拼接、切割等。有效加速典型网络结构如VggNet、GoogLeNet、ResNet等。

我们基于FPGA的深度学习硬件,定制优化了主流深度学习平台,如caffe等,您可以直接将深度学习业务切换到FPGA平台,而无需考虑底层硬件细节。

通过使用预先训练好的ResNet-50进行图像分类性能的对比测试,在CPU、GPU和FPGA三类设备的物理机上的测试结果如下:

其中:

  • CPU为Intel Xeon CPU E5-2650 v3,使用OpenBLAS占用4核进行测试
  • GPU为Nvidia Tesla K40m

测试结果可以明显看到FP