Xilinx 推出新类别平台的首款平台 —— Versal
利用软件可编程性与可扩展的 AI 推断技术支持快速创新
2018 年 10 月 16 日,中国北京 - 赛灵思开发者大会 (XDF) —自适应和智能计算的全球领先企业赛灵思公司(Xilinx, Inc.,(NASDAQ:XLNX))首席执行官 Victor Peng 宣布推出 Versal™ – 业界首款自适应计算加速平台 (Adaptive Compute Acceleration Platform ,ACAP),从而为所有的开发者开发任何应用开启了一个快速创新的新时代。Versal ACAP 整合标量处理引擎、自适应硬件引擎和智能引擎以及前沿的存储器和接口技术,能为所有的应用提供强大的异构加速功能。不过,最重要的是, Versal ACAP 的硬件和软件均可由软件开发者、数据科学家和硬件开发者进行编程和优化,这要归功于其符合业界标准设计流程的一系列工具、软件、库、IP、中间件和框架。
Versal 产品组合基于 台积电(TSMC)的 7 nm FinFET 工艺技术,是第一个将软件可编程性与特定领域硬件加速和灵活应变能力相结合的平台,这对于跟上当今快速的创新步伐至关重要。该产品组合包括 6 个系列的器件,其独特架构针对云端、网络、无线通信乃至边缘计算和端点等不同市场的众多应用提供了可扩展性和 AI 推断功能。
赛灵思总裁及CEO Victor Peng 指出:“随着 AI 和大数据的爆炸性发展以及摩尔定律的放缓,行业已经走到了一个关键的转折点。芯片设计的周期已经无法跟上创新的脚步。Versal 历经 4 年的开发,是业界首款 ACAP。我们对其进行了独特设计,支持所有类型的开发者通过优化的软硬件来为他们的整体应用提速,同时具备即时的灵活应变能力,从而能够跟上科技快速发 展的步伐。在业界需求最迫切的时刻 ACAP 雪中送炭。”
该产品组合包括 Versal 基础系列( Versal Prime),Versal 旗舰系列 (Versal Premium旗舰)系列和 HBM 系列,能针对要求最严格的应用提供业界领先的性能、连接性、带宽和集成功能。此外,该产品组合还包括 AI 核心系列(AI Core),AI 边缘系列 ( AI Edge) 和 AI 射频系列(AI RF),采用突破性的 AI 引擎。AI 引擎是一种新型硬件模块,专为解决各种应用低时延 AI 推断的新需求而设计,同时支持高级 DSP 实现方案,满足无线和雷达等应用要求。它与 Versal 自适应硬件引擎紧密结合,支持整体应用加速,也就是说软硬件都能调节,从而确保最高性能和效率。
该组合中率先亮相的是 Versal Prime 系列,跨多个市场提供广泛的适用性,同时推出的还有 Versal AI Core 系列,相对于业界领先的 GPU[1],AI 推断性能预计能提升 8 倍。
VERSAL AI 核心系列
Versal AI 核心系列提供该系列最高计算性能和最低时延,实现突破性的 AI 推断吞吐量和性能。该系列针对云端、网络和自动驾驶技术进行了优化,提供业界最广泛的 AI 和工作负载加速功能。Versal AI 核心系列 有 5 款产品,提供 128 到 400 个 AI 引擎。该系列包括双核 Arm® Cortex™-A72 应用处理器、双核 Arm® Cortex™-R5 实时处理器、256KB 片上 ECC 存储器、超过 1900 个专为高精度低时延浮点运算而优化的 DSP 引擎。此外,它还包括 190 多万个系统逻辑单元以及超过 130Mb 的 UltraRAM、高达 34Mb 的块 RAM 和 28Mb 分布式 RAM 和 32Mb 新加速器 RAM 块,任何引擎都能直接访问,这也是 Versal AI 系列的独特之处,而且都能支持定制存储器架构。该系列还包括 PCIe® Gen4 8 信道和 16 信道以及 CCIX 主机接口、功耗优化型 32G SerDes、多达 4 个集成型 DDR4 存储器控制器、多达 4 个多速率以太网 MAC、650 个高性能 I/O(用于 MIPI D-PHY)、NAND、存储级内存接口和 LVDS、78 个多路复用 I/O(连接外部组件)和超过 40 个 HD I/O(3.3V 接口)。以上所有器件均通过业界一流的片上网络 (NoC) 实现互联,具有多达 28 个主/从端口,以低时延提供每秒多 Tb 带宽,而且提供高功率效率和原生软件的可编程性。完整的产品列表现已发布。
THE VERSAL PRIME 系列
Versal Prime 系列经过精心设计,适用于多个市场的广泛应用,并针对各种工作负载的连接性和在线加速进行了优化。这款中端系列包括 9 款产品,每款产品都采用双核 Arm® Cortex-A72 应用处理器、双核 Arm® Cortex-R5 实时处理器、256KB 片上存储器(带 ECC)、超过 4000 个专为低时延高精度浮点运算优化的 DSP 引擎。此外,它还包括 200 多万个系统逻辑单元,结合 200Mb 以上 UltraRAM、超过 90Mb 的块 RAM 以及 30Mb 分布式 RAM,能支持定制存储器架构。该系列还包括 PCIe® Gen4 8信道和 16 信道以及 CCIX 主机接口、功耗优化型 32Gb 每秒的 SerDes 和主流 58Gb 每秒的 PAM4 SerDes、多达 6 个集成型 DDR4 存储器控制器、多达 4 个多速率以太网 MAC、700 个高性能 I/O(支持 MIPI D-PHY)、NAND、存储级内存接口和 LVDS、78 个多路复用 I/O(连接外部组件)和超过 40 个 HD I/O(3.3V 接口)。以上均通过业界一流的片上网络 (NoC) 实现互联,具有多达 28 个主/从端口,以低时延提供每秒多 Tb 带宽,而且提供高功率效率和原生的软件可编程性。完整的产品列表现已发布。
VERSAL 工具和软件
Versal 产品组合得到开发环境支持,提供全面的软件堆栈,包括驱动程序、中间件、库和软件框架支持。关于软件编程工具的更多详情将于明年发布。
供货情况
赛灵思目前正通过早期试用计划与多家关键客户合作。Versal Prime 系列和 Versal AI Core 系列将于 2019 年下半年上市。
如需了解有关 Versal、 AI 引擎、 Versal Prime 系列和 Versal AI Core 系列的更多信息,敬请访问我们的网站。如需了解有关赛灵思及其突破性技术的更多信息,敬请访问赛灵思中文网站:china.xilinx.com。
关于赛灵思
赛灵思致力于通过开发高度灵活和自适应的处理平台,为从端点到边缘再到云端的多种不同技术的快速创新提供支持。赛灵思是 FPGA、硬件可编程 SoC 及 ACAP 的发明者,旨在提供业界最具活力的处理器技术,实现自适应、智能且互连的未来世界。如需了解更多信息,敬请访问赛灵思中文网站:http://china.xilinx.com/。
脚注:
[1] 与 Tesla V100 相比,低于 2ms 的 CNN 时延性能
|