首页 - 股票 - 美股市场 - 美股评论 - 正文

为ChatGPT提速10倍!芯片巨头放大招:AI的“iPhone 时刻”已来

来源:格隆汇 2023-03-22 09:34:29
关注证券之星官方微博:

(原标题:为ChatGPT提速10倍!芯片巨头放大招:AI的“iPhone 时刻”已来)

在AI浪潮扑面而来之际,芯片巨头英伟达再次丢出“核弹级“产品,并高呼“切勿错过AI的决定性时刻!”。

当地时间周二,英伟达举办2023年春季GTC大会,CEO黄仁勋向开发者披露最新的硬件和AI应用软件进展。会上,他不仅多次提到生成式AI和ChatGPT,而且多次表示AI的“iPhone时刻”已经来临。

此外,还围绕AI、量子计算、芯片等前沿科技,发布了一系列超级重磅的技术和产品。


AI的“iPhone 时刻”已来


“我们正处在AI的iPhone时刻,初创公司竞相构建具有颠覆性的产品和商业模式,而老牌公司则在寻求应对之法,生成式AI引发了全球企业制定AI战略紧迫感,”

黄仁勋表示,近四十年来,摩尔定律一直是引领计算机行业动态发展的重要规律,而计算机行业又影响着各行各业的发展,但在成本和功耗不变的情况下,性能的指数级增长已经放缓。

然而,计算技术的发展日新月异,曲速引擎是加速计算,动力来源就是AI。各行各业正在应对可持续发展、生成式AI和数字化等强大的动态挑战,因此加速计算和AI的到来恰逢其时。

黄仁勋表示,在过去十年中,加速和纵向拓展的结合,使我们能够为许多应用实现百万倍性能提升,进而有助于解决以前无法解决的问题。虽然存在很多示例,但最著名的一个是深度学习。

“加速计算并非易事,2012年,计算机视觉模型AlexNet动用了GeForce GTX 580,每秒可处理262 PetaFLOPS。该模型引发了AI技术的爆炸。”“十年之后,Transformer出现了,GPT-3动用了323 ZettaFLOPS的算力,是AlexNet的100万倍,创造了ChatGPT这个震惊全世界的AI。崭新的计算平台出现了,AI的‘iPhone时刻’已经来临。”


为ChatGPT提速10倍!


在黄仁勋的主题演讲中发布了全新的GPU推理平台。

该平台包括4种不同配置,针对不同工作负载进行优化,分别对应了AI视频加速、图像生成加速、大型语言模型(LLM)加速和推荐系统和LLM数据库。包括:L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超级芯片。

据悉,H100 NVL是专门为LLM设计的GPU,采用了Transformer加速解决方案,可用于处理ChatGPT。

“当前唯一可以实际处理ChatGPT的GPU是英伟达HGX A100。与前者相比,现在一台搭载四对H100和双NVLINK的标准服务器速度能快10倍,可以将大语言模型的处理成本降低一个数量级。”

另外,英伟达最新确认,H100 NVL预计将在今年下半年上市。

另外,L4是针对AI生成视频的通用GPU,用于加速AI视频,可以提供比CPU高120倍的性能,能效提升约99%。

 L40则是用于图像生成,针对2D、3D图像生成进行优化,并可以结合Omniverse,直接生成3D内容,甚至是元宇宙内容。其性能是英伟达最受欢迎的云推理GPU T4的10倍。

Grace Hopper超级芯片则是为推荐系统和大型语言模型AI数据库设计的。可用于图推荐模型、向量数据库和图神经网络。它可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。


还有这些重磅产品


除此之外,在GTC大会上,英伟达还发布了AI超级计算服务DGX Cloud、突破性的光刻计算库cuLitho、云服务NVIDIA AI Foundations等,以及与Quantum Machines合作推出了全球首个GPU加速量子计算系统。

其中,DGX Cloud提供了专用的 NVIDIA DGX AI超级计算集群,用户能够按月租用这些计算资源,并使用简单的网络浏览器访问。从而消除在本地获取、部署和管理基础设施的成本,大大增加了AI的便捷性。

该服务目前已经与Microsoft Azure、Google GCP和Oracle OCI开展合作。每个DGX Cloud实例都具有八个H100或A100 80GB Tensor Core GPU,每个节点共有640GB GPU内存。

另外,发布的光刻计算库cuLitho可将计算光刻加速40倍以上。

“计算光刻是芯片设计和制造领域中最大的计算工作负载,每年消耗数百亿CPU小时。大型数据中心24x7全天候运行,以便创建用于光刻系统的掩膜板。这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。”

据悉,全球最大晶圆厂台积电、全球光刻机霸主阿斯麦、全球最大EDA巨头新思科技均参与合作并引入这项技术。该计划旨在加快制造光掩模的任务,光掩模是塑造光投射到硅晶片上以制造电路的方式的屏幕。 

最新发布的全新云服务及代工厂NVIDIA AI Foundations包括语言、视觉和生物学模型制作服务。

另外,英伟达还推出了量子计算。英伟达与Quantum Machines合作推出了一个量子控制链路。它可将英伟达GPU连接到量子计算机,以极快的速度进行纠错。据悉,NVIDIA DGX Quantum是全球首个GPU加速的量子计算系统,可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟。

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-