看了这篇才明白为什么GPU选型要挑M60

从深度学习到人工智能,近几年GPU逐渐走入人们的视线,它使得大规模计算神经网络成为可能。在众多不同系列和规格复杂的情况下,如何选择适合的卡来做计算成为很多人遇到的问题。

近日,美团云GPU云主机正式上线开放使用。在GPU选型方面,美团云目前主要使用NVIDIA Tesla系列专业加速计算设备M60。这一选型是基于多个维度的详细测试分析对比。今天我们把测试结果分享出来,相信会对想要购买美团云GPU云主机的人有很大帮助。

目前在深度学习领域,主流的商用GPU型号是K40、M40以及M60,我们将对比这三款产品的关键性能参数,并确定性价比最优的产品。官方的参数对比如下:

M60 拥有两个 GM204 核芯,每个 GM204 核芯拥有 2048 个计算单元,拥有8G显存,单精度浮点性能可达 4.85Tflops。在美团云上,一个 M60 的 GPU云主机是拥有一个 GM204 核芯的计算能力,售价为 1.2 元/时(仅GPU,不包括CPU、内存、网络、磁盘的价格)。

M40 拥有一个 GM200 核芯,该核芯拥有 3072 个计算单元,拥有12G显存,单精度浮点性能可达 7Tflops。在美团云上,一个 M40 的 GPU云主机是拥有一个 GM200 核芯的计算能力,售价为 2.5 元/时(仅GPU,不包括CPU、内存、网络、磁盘的价格)。

K40 拥有一个 GK110 核芯,该核芯拥有 2880 个计算单元,拥有12GB显存,单精度浮点性能可达 4.29Tflops。出售时的价格是 1.8 元/时(仅GPU,不包括CPU、内存、网络、磁盘的价格)。

可见,一个 M40 云主机的计算能力约为一个 M60 云主机(只有一个GM204 核)的1.44倍,但是价格却超过M60的2倍;M40 云主机的计算能力约为一个 M60 云主机(只有一个GM204 核)的1.44倍,但是价格却超过M60的2倍;而K40 云主机的计算能力不如M60,却比 M60 贵。(美团云现已停售K40)

因此,美团云将M60作为GPU云主机主打型号,在双核M60的情况下,M60价格(2*1.2元/时)低于M40(2.5元/时),计算能力相比于M40却有大幅的优势。

为了验证实际的计算能力,我们设计了两个实验:

实验一 我们用 Google im2txt 图像标注模型,数据集采用flickr8k,模型是 CNN + RNN,仅训练 RNN 部分的 LSTM,进行2000次迭代训练。

M40云主机用的时间是 575s,M60云主机用的时间是 892s,K40云主机用的时间是 1253s,可见在 LSTM 训练时 M40 的性能是 M60 的 1.55倍。M60的性能是K40的1.4倍。

实验二 我们用 cifar10_cnn 模型,数据集采用cifar10,进行50个 epoch迭代训练。

M40云主机用的时间是 858s,M60云主机用的时间是 931s,K40云主机用的时间是1143s,可见在 CNN 训练时 M40 的性能是 M60 的 1.08倍,M60的性能是K40的1.23倍,M60几乎不逊色于M40。

综上所述,在K40、M40、M60中,M60拥有最高的性价比。

发布于 2017-07-10