服务器的CPU、GPU、TPU，到底谁的运算能力更高

浏览量:1205 时间：2023-08-16 05:34:05

我们知道，任何一台计算机，也包括智能手机，游戏机等有计算能力的设备，都有一个计算的核心芯片，叫做CPU（Central Processing Unit），即中央处理器，它负责所有的计算，并且控制计算机的全部工作。

CPU的性能从上个世纪60年代中期开始，几乎按照每18个月翻一番的速度在进步，从1965年至今，差不多翻了34次了，也就是说计算速度提高了160亿倍。如果再把这个进步分解一下，又可以分成两个维度，一个是主频的提高，另一个是集成电路芯片密度（称为集成度）的提高。

序列号	CPU	RAM	HDD	带宽	售价（美元）	免费试用
香港服务器1	E5-2620	32G	1T HDD	50M/无限流量	$196.00	立即申请
香港服务器2	E5-2650	32G	1T HDD	50M/无限流量	$256.00	立即申请
香港服务器3	E5-2680	32G	1T HDD	50M/无限流量	$316.00	立即申请
香港服务器4	E5-2690	32G	1T HDD	50M/无限流量	$336.00	立即申请
香港服务器5	E5-2697	32G	1T HDD	50M/无限流量	$376.00	立即申请
香港服务器6	E5-2620*2	32G	1T HDD	50M/无限流量	$376.00	立即申请
香港服务器7	E5-2650*2	32G	1T HDD	50M/无限流量	$436.00	立即申请
香港服务器8	E5-2680*2	32G	1T HDD	50M/无限流量	$476.00	立即申请
香港服务器9	E5-2690*2	32G	1T HDD	50M/无限流量	$556.00	立即申请
香港服务器10	E5-2697*2	32G	1T HDD	50M/无限流量	$596.00	立即申请
香港服务器11	E5-2680v4*2	32G	1T HDD	50M/无限流量	$696.00	立即申请
香港服务器12	E5-2698v4*2	32G	1T HDD	50M/无限流量	$796.00	立即申请

主频提高后，本来一秒钟算10万个周期，现在可以算30亿个，增加了几万倍。密度提高后，本来几个周期完成一次计算任务，现在可以流水作业、分工合作，一个周期完成好几次计算。两者的加速是叠加的，使得今天计算机的速度变得飞快。

但是，CPU的主频不可能无限制提高，因为光速是一个绝对的瓶颈，今天计算机CPU内部，电子运动的速度已经接近光速所给的极限了，几乎没有了再提高的可能性，事实上从10年前开始，这条路就走不通了。

那么怎么办呢？英特尔公司的办法是，将计算机CPU的集成度进一步提高，最早一个集成电路中只有几千个晶体管，今天最多的有60亿个，这样计算可以并行开展，这也是为什么我们计算机和手机CPU有什么四核、八核之说。

那么接下来，为什么不能做成16核、32核甚至100核呢？因为以今天的工艺，做到那么多核处理器的体积要大得不得了，光是散热问题就没法解决。面对这个问题怎么办呢？英特尔总的态度是，没法解决，你们多买我一些处理器，多建造一些服务器，再把计算中心修得大一点就好了。且不说这个法子灵不灵，在很多场合也没有条件这么做，比如在无人驾驶汽车中，总不能扛着一个机柜上路吧。

我们知道，有主动性的人，总是想方设法寻找更好的解决方法。英伟达的创始人黄仁勋就是这样的人。黄仁勋和他在英伟达的同事就想，CPU的计算速度之所以不够快，是因为它被设计成能够适应所有的计算了，里面很多晶体管都用来搭建控制电路了。

另外，因为计算太复杂，因此处理器本身设计得太复杂。而在计算机里面，有一种计算相对单一，就是控制显示器的图形计算，于是英伟达就为这一类计算专门设计了一种处理器，叫做GPU，即图形处理器。

当然，在英伟达之前，做图形工作站的太阳公司和SGI公司也设计出类似的产品，但是不通用。GPU比CPU的好处有两个：

第一，控制电路简单了，因此更多的晶体管用于了计算，而不是控制，这样本来10亿个晶体管可以搭建四个内核，还有希望搭建八个、十六个甚至更多。

第二，将单个儿单个儿的计算，变成一批一批的计算。在现实生活中，大部分的计算每次都是在两个数之间进行的，比如A＋B＝C，它是一个运算指令（“+”）带上两个数字（“A”和“B”），下一次做X－Y，是另一个运算指令（“－”）带上另外两个数字（“X”和“Y”）。因此计算机处理器实际上是按照一个指令通道（流）对应一个数据通道设计的（被称为SISD）。打个不很恰当的比方，一般的计算就如同你蹲在地上一个个地捡豆子。

而图形计算是整个一条线（在计算机科学里被称为向量）按照同一种操作一口气算完，比如A1+B1=C1，A2+B2=C2，……，最后A1000+B1000=C1000，对于这些计算来讲，指令都是一样的，只是使用不同的数据而已，因此它可以设计出非常多的功能简单的计算核心，然后对一条指令开发很多数据通道（即所谓的SIMD）即可。

这就相当于用一个吸尘器在地上吸豆子，你走过一条线，就吸起一大堆，效率就高多了。对此，英伟达提出一种所谓的“统一计算架构”（CUDA）的概念，就是很多很多核都做同一件事情，并且在此基础上设计出图形处理器GPU。

有了GPU，很多重复一致的计算就可以并行了。GPU最早是针对图形计算设计的，但是后来英伟达发现机器学习的算法也可以用这种方式实现，于是到了2016年，英伟达又针对机器学习的特点，设计了针对机器学习的GPU，它最新的P40处理器内部有多达3000个所谓“统一计算架构”的内核。

虽然每一个能力都比不上英特尔四核处理器中的一个内核，但是P40等GPU的内核数量非常多，因此做人工智能计算就非常快。今天特斯拉搞的辅助驾驶，一片这样的处理器就能解决所有的问题。在去年对阵李世石的AlphaGo中，就是用了176个英伟达的GPU，承担了主要的计算功能。

但是毕竟机器学习中的向量计算和通用的向量计算还是有所不同，能否让计算的内核功能再专一一点，只做和一种非常特定的机器学习算法（即Google的人工神经网络算法）相关的向量计算呢？

于是，Google提出了一种张量（Tensor）计算的概念。所谓张量，它原本是一个数学概念，表示各种向量或者数值之间的关系。比如你的两张照片是两个不同的向量，它们之间的一些相似性就是一个张量。人工神经网络的算法可以看成是张量的计算，至于为什么，大家不必细究，记住这个结论就可以了。

接下来，Google就在英伟达等公司GPU的基础上，进一步让计算变得专注，设计了一种仅仅针对特定张量计算的处理器，叫做TPU，其中T就代表张量（Tensor）。Google宣称，一个TPU对AlphaGo这样的任务，效率抵得上15-30个英伟达的GPU，这也就是为什么这一次Google讲新版的AlphaGo在硬件上瘦身了的原因。

去年战胜李世石的AlphaGo的耗电量是人脑的300倍，如今的AlphaGo用的机器少了很多，至少少了一个数量级，也就是说耗电量从人脑的300倍下降到30倍以下，这个进步速度还是很惊人的。

当然，英伟达表示不服气，说你Google是在拿苹果和橘子比，而用我的测试处理器性能的程序来评测，我的P40可比你的TPU快多了。其实TPU和GPU谁更好，完全要看做什么事情了。

从CPU到GPU，再到TPU，效率提升的根本原因在于两个字——专注，相比之下，我们手机和电脑的CPU是非常“不专注”的。

在社会生活中，情况和计算机处理器其实很相似。工业革命开始后，英国工厂主把分工做得特别细，于是效率大增。亚当·斯密在《国富论》中讲，即使是制作缝衣服针这件事，当分工很细致后，一个工人一天能生产上千根，如果一个工人做所有的工序，一天恐怕连10根都做不了。因此，英国工业革命后，就把整个欧洲的加工业碾压了。这其实就好比TPU和CPU的关系。

但是，TPU的使用有一个前提，就是这种芯片的市场至少要有上百万片，否则就不值得做，因为它做一个样片的成本就得上百万美元，而设计成本则是上千万。如果市场需求量只有几万片，还不如用很多CPU来工作呢。这就如同制作缝衣服针，一年仅欧洲恐怕要用到上亿根，才值得做社会分工。如果只用三五十根，还不如让几个工人慢慢磨呢！因此，分工和专注的前提都是市场规模足够大。

最后讲一下人的技能，什么时候需要专而精，什么时候需要广博，其实没有一定之规，但是一个很好的判断标准就是市场是否大到需要非常专而精。

英伟处理器张量向量计算机

上一篇：服务器流量突然增加？你可能遭到了DDOS攻击

下一篇：国内解析速度最快的开源 JSON 解析库fastjson stars用户数量突破2万

按类型查看

帮助中心

香港站群服务器在 SEO 优化中的作用

香港站群服务器在 SEO 优化中的作用站群是指由多个网站组成的一个网络，通常用于 SEO（搜索引擎优化）或流量分发的目的。站群服务器是指托管站群的一台或多台服务器，它们需要有足够的硬件资源和软件优化，以保证站群的正常运行和高效性...

怎样搭建tittok专用节点?tittok搭建方法教程!快速搭建tittok节点海外电商小白教程

哪里有带显卡的服务器？带显卡的服务器可以用来做什么？

在服务器租用市场，服务器的类型非常多，从最开始的虚拟主机到后来的VPS，再到独立服务器以及云服务器，我们在租用服务器产品的时候一般选择的服务器产品配置主要看重服务器CPU的参数，比如CPU的型号、频率、核心数、线程数；服务器内存大小；磁盘储...

关于平台升级的通知！

用户您好：近期我公司在对平台系统进行升级，如您在使用体验过程中发现问题或者有任何建议的，可以向客服提出来哦，收录建议之后有丰富好礼！若由此给您带来的不便之处敬请谅解！创诚网络(FWQ118.COM)，顺祝商祺！创诚网络(FWQ118.COM...

拨号VPS丨adsl动态IP拨号服务器是什么？

adsl拨号服务器又叫动态拨号服务器、动态服务器或者拨号服务器，主要是相对于平常所见到的固定IP 的VPS服务器而言的。创诚网络(FWQ118.COM)adsl拨号服务器可以在VPS服务器上实现更换IP的作用，拨一次号换一次IP，从而实现不...

美国高防服务器的防御性能怎么样？相比其他地区高防服务器有什么优势？

作为互联网发源地的美国来说，在互联网技术方面以及基础设施建设方面自然在全球都是处于比较领先的地位的。那么美国高防服务器在全球来看，相比其他地区的高防服务器有什么优势呢？美国高防服务器的防御能力又是怎样的呢？下面淘梦科技来为大家介绍一下。在高...

一万人的游戏服务器要多少钱？配置是什么样的

一万人的游戏服务器需要多少钱?配置是什么样的？根据游戏类型和品质的不同，对于游戏服务器的选择来说，需求也会不同。当然对应的配置决定着游戏服务器租用时的成本，下面创诚网络(FWQ118.COM)（www.tm服务器.cn）具体给大家分析一下一...

拨号VPS丨谈一谈爬虫工作中动态ip拨号服务器的重要性

对于从事互联网工作的小伙伴来说，动态ip拨号服务器并不是一个陌生的存在，如果你恰好是做技术敲代码的专业人才，尤其是要负责网络爬虫的相关工作，那么每天跟你打交道比较多的就是动态ip拨号服务器了。用简单一点的话说，动态ip拨号服务器就是你的通行...

江苏高防服务器机房都有哪些？江苏高防服务器防护性能如何

相比起海外高防服务器来说，国内现在也有不少被大家所熟知的高防服务器机房，不过在早期的时候主要集中在南方地区，比如佛山高防服务器机房、福州高防服务器机房、绍兴高防服务器机房以及江苏各地的高防服务器机房等等。随着近年来IDC行业的发展，国内比较...

互联网金融如何把关网络安全

在社会发展加速的今天，金融行业逐渐从线下向线上业务发展。前几年的互联网金融产品井喷式的发展一定程度上推广了互联网金融，并且使大众对互联网金融产品的接受度大大增加。然而近年来互联网金融界大热的数字货币频遭攻击，一些大型公司在攻击后遭到损失，股...

香港服务器

帮助中心

服务器的CPU、GPU、TPU，到底谁的运算能力更高

浏览量:1205 时间：2023-08-16 05:34:05

站群服务器

独立服务器

高防服务器

大带宽服务器配

新闻中心

关于我们