黄仁勋的“厨房演讲”,熬制的却是英伟达GPU史上最大性能飞跃
第一次,在自家的厨房里,英伟达创始人兼CEO黄仁勋开始了GTC2020的演讲。
「未来十年,数据中心的规模计算将成为标准。」说完,老黄从自家的烤箱里拿出了全新的安培(Ampere)架构GPU,7nm工艺,540亿晶体管,20倍AI算力的提升。
每次带来全新架构,都必然是一次「性能跃迁」。只是这次它不是开启了一个全新的大门,而是作为最后一块砖,补齐了英伟达在数据科学与AI应用上的完整版图。
去年的GTC2019,黄教主罕见的没有放出「重磅核弹」传言中的下一代7nm产品以及新架构也并没有出现,而更加强调「生态」优势与「落地」的英伟达却仿佛要从侧翼用「软件生态」构筑起一道护城河。
在高性能计算之下,收购「绝配」的高性能网络公司Mellanox和CumulusNetworks,借助这两个公司组成的新业务部门,老黄开始逐渐加深其在数据中心领域的强劲增长。
今天,依靠这次带来的新的Ampere图形架构,在AI计算、数据中心等领域上让英伟达获得了全面的「能力升级」。
黄仁勋的「厨房演讲」|英伟达官方
英伟达之前的成长很大程度上是依靠其游戏GPU处理器。如今,英伟达逐渐开始在众多人工智能AI应用程序方面显现巨大的增长潜力。英伟达在AI领域的处理器,可以帮助提高AI语意理解能力,优化搜索引擎建议,甚至赋能公共云以及物流,零售和仓储等垂直行业。
在疫情期间,这些行业和应用成为「必需品」。巨大的推动力也为英伟达的收入和收益带来了高于平均水平的增长。更重要的是,这也让英伟达摆脱了短期加密货币的动荡影响,转身跨入了一个新的增长时代。
全面投产的新「核弹基地」
老黄今天宣布,基于NVIDIAAmpere架构的首个GPU,即NVIDIAA100,正在全面生产并向全球客户发货。
再说NVIDIAA100是「核弹」并不严谨,它更像是一个「核弹基地」。A100利用了英伟达安培架构的设计突破,在其8代GPU中提供英伟达迄今为止最大的性能飞跃,将性能提高到其前辈的20倍。
NVIDIAA100GPU|英伟达官方
同时,它是一个端到端机器学习加速器——从数据分析到训练再到推理。第一次在一个平台上来统一人工智能训练和推理。A100是一个通用的工作负载加速器,它也是为数据分析、科学计算和云图形设计的。
「云计算和人工智能的强大趋势正在推动数据中心设计的结构性转变」黄仁勋说,「过去纯CPU服务器的海洋,正在被GPU主导的加速计算基础架构所取代。」
黄仁勋说,买得越多,省得越多。(BuymoreGPUs,themoremoneyyousave.)|官方Keynote
而贯彻「买更多,省更多」的宗旨,NVIDIAA100将同时提高吞吐量并降低数据中心的成本。
A100内置了新的弹性计算技术,可「灵活拆分」计算能力。多实例GPU能力允许每个A100GPU被分割成多达七个独立的实例来推断任务,而第三代NVIDIANVLinkinterconnect技术允许多个A100GPU作为一个巨型GPU运行,以完成更大的训练任务。
第一批利用NVIDIAA100GPU的是微软,它将利用NVIDIAA100的来训练图灵自然语言生成,这个世界上最大的语言模型。疫情期间,这也让外卖巨头DoorDash获得了更强的能力,「这有助于减少模型训练时间,加快机器学习的开发过程。」DoorDash的机器学习工程师GaryRen说。早期采用者还包括国家实验室和一些世界领先的高等教育和研究机构。
NVIDIAA100很快就会进入云计算。包括BAT在内的云业务,字节跳动、谷歌云、亚马逊云(AWS)等几乎主流大厂都将在产品中加入A100GPU。
当然关于NVIDIAA100GPU,英伟达认为这是一项「技术设计突破」,英伟达自己总结了五个关键创新推动:
●NVIDIA全新安培Ampere架构——A100的核心是NVIDIAAmpereGPU架构,它包含超过540亿个晶体管,使其成为世界上最大的7纳米处理器。
●使用第三代TensorCoreAI核心,现在更加灵活、更快、更容易使用。他们的扩展功能包括新的人工智能TF32,它允许高达20倍的FP32精度的人工智能性能,没有任何代码更改。此外现在支持FP64,为HPC应用提供了比上一代多2.5倍的计算能力。
●多实例GPU(Multi-instanceGPU)——MIG,一个新的技术特性,可以将一个A100GPU分割成多达7个单独的GPU,这样它就可以为不同大小的任务提供不同程度的计算,提供最优的利用率和最大的投资回报。
●第三代NVIDIANVLink——使GPU之间的高速连接加倍,从而在服务器上提供高效的性能扩展。
●结构稀疏性——这种新的效率技术利用了人工智能数学固有的稀疏性,使性能提高了一倍。
NVIDIAA100|英伟达官方
总之,这些新特性使NVIDIAA100成为多样化、高要求工作负载的理想选择,包括人工智能培训和推理以及科学模拟、会话人工智能、推荐系统、基因组学、高性能数据分析、地震建模和财务预测。
今天英伟达也开始与开源社区合作,将端到端GPU加速引入ApacheSpark3.0,这是一个用于大数据处理的分析引擎,全世界有50多万数据科学家使用它。NVIDIA的企业计算主管ManuvirDas说:「数据分析是当今企业和研究人员面临的最大的高性能计算挑战。」「从ETL到训练再到推理,整个Spark3.0的GPU加速提供了最终连接大数据潜力和人工智能能力所需的性能和规模。」Adobe是首批在Databricks上运行Spark3.0预览版的公司之一。在最初的测试中,它的性能提高了7倍,节省了90%的成本。它使用GPU加速数据分析,用于Adobe体验云中的产品开发,并支持支持数字业务的功能。
从「新玩家」到宝马工厂,汽车行业的全面「渗透」
NVIDIADRIVEAGX正为汽车行业初创公司提供AI驱动力。
在GTCDigital期间,电动汽车和自动驾驶汽车初创公司小马智行(Pony.ai)、Canoo和法拉第未来(FaradayFuture)纷纷宣布借助NVIDIADRIVEAGX计算平台开发汽车。这个高性能、高能效的平台可实现跨级别的自动驾驶,帮助企业进行可靠的软件定义车辆开发。
这几家公司全都加入了一个广泛的全球生态系统。该系统中的汽车制造商、一级供应商、卡车制造商、传感器供应商、Robotaxi公司和软件初创公司均在NVIDIADRIVE上进行开发。
自动驾驶技术公司小马智行正在NVIDIADRIVEAGXPegasus上开发其新一代Robotaxi车队。自2018年以来,该公司一直在加利福尼亚州和中国测试自动驾驶车辆的叫车服务。今年4月,小马智行开始在加利福尼亚州尔湾市提供自动派送服务,帮助因新冠疫情影响而在该地区隔离的人。
借助DRIVEAGXPegasus自动驾驶平台来满足Robotaxi上市所需的海量计算需求。Pegasus计算平台可实现每秒320万亿次(TOPS)深度学习运算,内置两个NVIDIAXavier处理器和两块NVIDIATuringTensorCoreGPU。
电动汽车初创公司Canoo推出了一款时尚的电动汽车,这款汽车的风格类似于大众经典车型Microbus的未来风格。这款专用于共享出行服务的汽车将于2021年下半年投入生产。
Canoo汽车将配备NVIDIADRIVEAGXXavier驱动的AI辅助驾驶功能。该计算平台具有30TOPS物体探测和传感器融合性能,能够运行构建十字路口警报、盲点探测和行人探测功能的先进算法,以及自适应巡航控制和车道偏离预防等便捷功能。
软件定义的DRIVEAGXXavier还能引入更多市面上推出的高级功能,例如自动车道变换、交通信号识别和规避转向等。
小鹏最新推出的P7的XPILOT3.0就是使用了英伟达DRIVETMAGXXavier平台。目前,小鹏还宣布将在下一代生产车型中利用DRIVE平台,小鹏自动驾驶副总裁吴新宙博士说,「我们非常高兴能在下一代电动汽车生产模式上扩大与NIVIDA的合作。」
就连许久未发声的新造车鼻祖法拉第未来(FaradayFuture)也宣布将在其旗舰豪华FF91电动车上部署NVIDIADRIVEAGXXavier平台,开发新一代FF91。根据FF的新计划,FF91将在成功完成股权融资约9个月后开始交付。最新发布的FF81EV还将配备DRIVEAGXXavier,以及未来的型号和下一代核心技术。
宝马集团也在今天宣布,公司已经选择了新的NVIDIAIsaac机器人平台来加强其汽车工厂——利用建立在先进的人工智能计算和可视化技术上的物流机器人。
「利用人工智能和机器人技术上的突破,创造出可高度定制、准时化、顺序化的下一代生产模式。」老黄说。
宝马集团负责物流的高级副总裁JürgenMaidl说:「最终,大量可能的配置成为了宝马集团在三个基本领域的挑战——计算、物流规划和数据分析,」宝马集团(BMWGroup)的供应链需要从4500多个供应商站点向工厂输送数百万件零部件,涉及23万个独特的零部件编号。目前,宝马销售的车辆平均有100种不同的选择,导致99%的客户订单彼此之间存在独特的差异。这给工厂物流带来了巨大的挑战。
合作的核心是实现一个基于英伟达技术的端到端系统——从培训和测试到部署——使用一种软件架构开发的机器人,运行在英伟达的开放Isaac机器人平台上。宝马集团的目标是提高物流工厂的流程,以生产定制配置的汽车更迅速和更有效。一旦开发完成,该系统将部署到宝马集团的全球工厂。
英伟达的增长源泉
黄仁勋一直说,人工智能是未来增长的巨大潜在驱动力。
第一个驱动因素是「推理」的概念。推理,也称为推理引擎,将逻辑规则应用于知识库以形成新信息。例如,可以利用客户购买历史、兴趣以及他们的位置等事实来确定针对性的营销计划。
而人工智能增长的第二个推动力是实现突破的模型算法能力。英伟达的产品具有低延迟性能,而AI应用程序例如语言识别/理解程序和互联网搜索推荐系统,这些系统现在正在使用深度学习。
第三个驱动力是公共云的增长。公共云的增长来自许多在云中开发AI软件的AI初创公司。黄仁勋(JensenHuang)表示,人工智能初创企业数量达数千家。由于公共云可以支持规模较小且刚刚起步的公司,因此易于使用。
人工智能的第四增长动力是垂直行业。这包括物流,零售和仓储。沃尔玛(WMT),美国邮政(USPS)和美国运通(AXP)等公司/组织拥有大量需要分析/预测分析的数据。
同时,这一领域还需要边缘AI计算。这样能保证进行实时操作,例如包括机器人、自动驾驶汽车的某些操作,数据创建以及需要在几毫秒内发生的决策。
我们可能会更容易的从AI中看到现实世界的解决方案:增强的购物体验(更好的库存系统/更智能的布局/更智能的结帐系统),增强的汽车自动驾驶视觉计算性能/解决方案,实时交通监控以确保更安全的道路,基因组计算,5G加速等等。
这些各种行业中AI应用程序的增长空间可能会给英伟达带来一个可以实现数年的持续增长的领域。GrandViewResearch估计,到2025年,全球AI市场将以每年约46%的速度增长。
我们发现,英伟达不在是一个单纯的GPU硬件公司,它正在成长为一个「生态型」的基础设施,跑在一个高速增长的时代下。