快捷搜索:  as

得益于人工智能/机器学习发展,FPGA智能网卡成新

受到人工智能/机械进修(AI/ML)的推动,数据中间/云端和边缘谋略市场快速成长。据懂得,数据中间加速器市场(包括CPU、GPU、FPGA和ASIC)估计将从2018年的28.4亿美元增长到2023年的211.9亿美元,年复合增长率(CAGR)达49.47%。此中,又以FPGA为增长最快的细分市场——企业级事情负载加速利用正对FPGA越来越多地采纳。

在这个市场中,智能网卡大年夜热,此中又以FPGA为新。日前,Achronix和BittWare(molex旗下子公司)合营宣布了基于Achronix Speedster 7t FPGA的VectorPathS7t-VG6加速卡,它让二线云办事供给商也能得到曩昔只有大年夜型云办事供给商才有的采纳FPGA规划的上风。

数据加速器四大年夜利用

据Achronix Semiconductor公司市场营销副总裁Steve Mensor先容,数据加速器的主要利用包括谋略、收集、存储和传感器处置惩罚四大年夜类。详细案例如下图所示。

“和AI相关的,像语音识别、图像识别、文本分析、语义识别等热门利用,GPU也能做,但DPI、收集加速、收集监控、负载均衡、雷达处置惩罚、医疗影像、气象预告等,是FPGA的传统利用领域,这些都不是GPU或CPU所能胜任的。”Mensor先容说,“在收集方面,曩昔对付10G以下的速度,都是用办事器CPU来进行处置惩罚,而到25G到100G,再用传统的办事器CPU,就来不及处置惩罚这些收集负载,由于CPU不仅要处置惩罚收集数据,还要处置惩罚利用营业。是以,几年前业界开始将一些收集处置惩罚交给FPGA来做。在存储方面,同理,跟着移动互联和5G孕育发生的数据越来越多,数据着末的存储与阐发假如照样依附办事器CPU处置惩罚,机能(处置惩罚速率)和功耗都将显明恶化。是以业界都在转用专用CPU或FPGA来卸载这些负载。在旌旗灯号处置惩罚方面,例如气象预告、雷达等都是传统的FPGA加速利用,在这之中,CPU只是用来节制。”

FPGA与传统CPU比拟机能提升

FPGA和传统CPU比拟,机能可提升10-100倍;在实现同样功能时,功耗会低得多。详细数据如下。

为何设计基于FPGA的PCIe加速卡?

下图是基于FPGA的PCIe加速卡的市场趋势。BittWare公司企业副总裁Sam Bichara先容说,FPGA在加速卡市场的采纳今朝正处于上升期。一个很好的例子便是最开始将FPGA用在数据中间的是微软,那时刻他们采纳的是Altera的规划。然后Amazon追随微软设计,用的是Xilinx的规划。这两家大年夜型云办事供给商有实力和工程资本将FPGA规划集成到自己办事器的板子上。而很多二线厂商没有这个设计实力但又想去用。

在数据中间中利用FPGA可以带来以下几个好处。

是以,BittWare联合Achronix宣布了VectorPath加速卡,其特点如下。

VectorPath加速卡功能一览

以下是其硬件功能和接口的概览。“PCIe业界今朝照样采纳Gen3 x16,这块板卡也是基于Gen3测试,但它是基于Gen4设计。未来,因为Achronix的FPGA芯片支持PCIe Gen5 32Gbps,是以跟着Gen4和Gen5成为办事器主流时,这个板卡只必要做软件进级,就可以在客户端利用。”Bichara说,“收集接口还会供给硬件MAC和PEC IP,支持客户做收集接口的开拓。收集接口有两种:QSFP56和QSFP-DD,分手供给200GbE和400GbE速度,并可经由过程铜缆和光模块分化成多路10/25/40/50GbE。存储主要采纳GDDR6,与集成到芯片内的HBM2比拟设置设置设备摆设摆设机动,价格很低。对付有些利用,没需要把数据和谋略放到GDDR6上,DDR4可以供给更好的性价比。OCuLink高速接口可实现接口扩展。它是PCIe规定的标准接口,可以和NVMe闪存直接连接,也可以做板卡级联,供给高速通道……”别的,它供给时钟和扩展接口。时钟输入用于级联,为每块板卡供给同步。GPIO接口则可以用于扩展附加利用和节制。”

什么是2D片上收集(NoC)?

下图阐清楚明了Speedster7t的部分特点。

Speedster7t供给独特的2D片上收集(NoC)。“这个收集异常紧张,它就好比城市里的高架路。传统的FPGA里是没有2D片上收集的,它里面的布线好比2车道、4车道,没有这么高的带宽。”

AFX是种标准接口,可以应用户异常轻易地把其逻辑接入到这个高速收集。这对开拓者来说开辟了一种新的开拓要领,大年夜大年夜低落了其开起事度。

Speedster7t NoC创始新的设计要领

下面是一个用传统FPGA设计的例子。“假定它里面有两个功能,它们都必要读取外部存储。为了完成这件工作,除了两个功能本身的逻辑外,它还有很多帮助电路——这在传统FPGA中必须存在,然则又没需要。外部存储器节制电路的频率异常高,比如DDR4是一两G,但FPGA内部功能一样平常只有几百M,这就必要跨时钟域处置惩罚电路。然后,在两个功能之间必要有仲裁电路,从而避免它们同时读取相同地址的存储单元。这就会占用FPGA内部的逻辑资本和布线资本,并使设计繁杂化。”

Speedster7t傍边具有二位片上收集,是以开辟了新的开拓场景。上述问题在Speedster7t上完全不存在,开拓者只要专注开拓自己的功能核心,然后把它连到高速收集即可——高速收集就会处置惩罚上述所有工作。

别的,Speedster7t专为谋略密集型人工智能/机械进修(AI/ML)利用而优化,特征如下。

同时供给TeraBox FPGA办事器

着末,BittWare除了供给FPGA板卡,还供给TeraBox FPGA办事器,从而可以让客户直接放在机架上运行营业。它的密度可以从1U扩展到5U,里面可以集成多种BittWare的基于FPGA的板卡,同时可以经由过程板卡去共同戴尔、慧与等OEM供应商。

约请

雷人

握手

鲜花

鸡蛋

途经

您可能还会对下面的文章感兴趣: