近年来,,,,,FPGA这一看法愈加频仍地引起大发28关注。。。。。。较量新颖的在比特币挖矿中就已泛起基于FPGA的矿机,,,,,而微软也曾高调宣布将在其数据中心里接纳FPGA替换CPU等古板盘算架构。。。。。。
关于专业人士来说,,,,,FPGA并不生疏,,,,,它在多个领域中获得了普遍应用。。。。。。然而,,,,,许多通俗人对FPGA的明确仍显薄弱,,,,,FPGA究竟是什么??????它的优势何在??????与CPU、GPU和ASIC相比,,,,,FPGA又有什么奇异之处??????这些疑问值得我们深入探讨。。。。。。
1
为什么选择FPGA??????
众所周知,,,,,CPU的摩尔定律已进入减速期,,,,,但机械学习和网络效劳的需求却在迅速上升。。。。。。为了加速常见盘算使命,,,,,行业越来越依赖定制硬件。。。。。。但快速转变的市场又要求这些定制硬件具备可重编程性,,,,,以便应对新型盘算使命。。。。。。
FPGA,,,,,即现场可编程门阵列,,,,,是一种硬件可重构的架构。。。。。。恒久以来,,,,,FPGA被视为ASIC的小批量替换品,,,,,而近年来,,,,,微软、百度等巨头在数据中心大规模应用FPGA,,,,,提供强盛的盘算能力与无邪性。。。。。。
2
FPGA的高效性源于其奇异的架构设计。。。。。。CPU和GPU依赖冯·诺依曼结构,,,,,需处置惩罚重大的指令集和共享内存。。。。。。而FPGA的每个逻辑单位在重编程时已确定其功效,,,,,挣脱了指令集的约束,,,,,使得FPGA在能效上显著优于CPU和GPU。。。。。。
在盘算麋集型使命中,,,,,如矩阵运算和机械学习,,,,,FPGA体现精彩。。。。。。例如,,,,,Altera Stratix V的整数乘法性能与20核CPU相当,,,,,而浮点运算性能与8核CPU相持平。。。。。。更令人期待的是,,,,,即将推出的Stratix10将具备更强的盘算能力,,,,,甚至靠近目今顶级GPU盘算卡。。。。。。

在数据中心情形中,,,,,FPGA的低延迟优势也很是突出。。。。。。以Bing搜索的排序使命为例,,,,,FPGA仅需微秒级的延迟,,,,,而GPU则可能面临毫秒级的延迟,,,,,影响用户体验。。。。。。
在通讯麋集型使命中,,,,,FPGA同样展现了其卓越的性能。。。。。。这类使命的处置惩罚重大性较低,,,,,但通讯往往成为瓶颈。。。。。。FPGA的收发器可直接毗连40 Gbps甚至100 Gbps的网络,,,,,以线速处置惩罚恣意巨细的数据包。。。。。。相较之下,,,,,CPU则需经由网卡处置惩罚,,,,,延迟和吞吐量受限。。。。。。
虽然GPU也能高效处置惩罚数据包,,,,,但由于缺乏网口,,,,,其性能经常受制于CPU和网卡的处置惩罚能力。。。。。。因此,,,,,FPGA在通讯麋集型使命中更具优势,,,,,能够提供稳固且低延迟的解决计划。。。。。。
3
2016年,,,,,微软的Catapult项目吸引了普遍关注。。。。。。该项目通过FPGA加速机械翻译,,,,,其盘算能力相当于10万块顶级GPU。。。。。。只管该项目的实验并非一帆风顺,,,,,微软在安排历程中履历了多个阶段的调解。。。。。。
最初,,,,,微软接纳专用FPGA集群的方法,,,,,但由于FPGA之间无法通讯,,,,,导致处置惩罚规模受限。。。。。。随后,,,,,微软转向在每台效劳器上安排FPGA,,,,,并通过专用网络毗连实现FPGA之间的通讯。。。。。。这一转变使得Bing的搜索排序性能提升了两倍,,,,,显著优化了资源使用。。。。。。
在Azure部分,,,,,随着网络和存储虚拟化的需求上升,,,,,FPGA被安排在网卡和交流机之间。。。。。。此举不但提高了虚拟机的网络性能,,,,,还将延迟降低了10倍,,,,,进一步提升了整体效率。。。。。。
FPGA在数据中心和云盘算中的应用潜力重大。。。。。。随着技术的一直演进,,,,,FPGA将可能在盘算资源的分派中占有更主要的位置。。。。。。通过与CPU的协同事情,,,,,FPGA将在未来的许多应用场景中实现逾越,,,,,同时迎来更辽阔的生长远景。。。。。。

大发28













