GTX 2080TI TensorFlow GPU基准测试：2018年最佳GPU

编程入门行业动态更新时间:2024-10-28 04:17:03

有人经常问，深度学习的最佳GPU是什么？近日Lambda给出了答案，他们通过比较研究人员常用的前5个GPU来获得答案（测试结果也考虑到了成本和性能）：

· 结 · 果 · 总 · 结 ·

截至2018年10月8日，NVIDIA RTX 2080 Ti是运行TensorFlow的单GPU深度学习研究的最佳GPU。其他与这款GPU相比将是：

· 结 · 果 · 深 · 入 ·

通过测量FP32和FP16吞吐量来评估每个GPU的性能，同时训练常见模型。我们将每个型号的GPU吞吐量除以1080 Ti的吞吐量，这降标准化数据并提供了每个GPU与1080 Ti的加速比，是衡量处理同一工作的两个系统的相对性指标。

各个型号上GPU的吞吐量

FP32所有模型的平均速度与1080 Ti的对比

FP16所有模型的平均速度与1080 Ti的对比

最后，我们将每个GPU的值除以系统成本来计算最佳GPU：

2080 Ti vs V100 2080 Ti真的那么快吗？

2080 Ti的速度比V100快80%，但是价格比V100便宜了非常多，这是为什么？答案很简单：NVIDIA希望细分市场，以便那些支付意愿比较高的人只购买他们的TESLA系列卡。RTX和GTX系列仍然提供较好的性价比。

如果您不是在使用AWS，Azure或者Google Cloud，那么贵买2080 Ti可能要好得多。但是，有一些关键的用例，V100可以派上用场：

如果你需要FP64计算，如果你正在进行计算流体动力学，N体模拟或者其他需要高数值京都（FP64）的工作，那么您需要购买Titan V100。如果您不确定是否需要FP64，则不需要。
如果你绝对需要32GB的内存，V100可能有意义。然而，这是很少见的，只有5%的用户有这样的需求。大多数人使用像ResNet、VGG、Inception、SSD或Yolo之类的。

所以，你还在想，为什么有人会购买V100？它归结为营销。

原始性能数据

FP32 吞吐量

Model / GPU	2080	2080 Ti	Titan V	V100	1080 Ti
ResNet-50	209.89	286.05	298.28	368.63	203.99
ResNet-152	82.78	110.24	110.13	131.69	82.83
InceptionV3	141.9	189.31	204.35	242.7	130.2
InceptionV4	61.6	81	78.64	90.6	56.98
VGG16	123.01	169.28	190.38	233	133.16
AlexNet	2567.38	3550.11	3729.64	4707.67	2720.59
SSD300	111.04	148.51	153.55	186.8	107.71