文 | 周鑫雨 编辑 | 苏建勋 北京时间2023年3月21日深夜,英伟达创始人兼CEO黄仁勋在2023 GPU技术大会(2023 GTC)上发表演讲。 若2021 GTC的重心还是车,那么从去年开始,AI和碳中和就成了英伟达GTC绝对的主角。 在今年GTC的官方预告中,黄仁勋表示:“AI 正迎来有史以来最辉煌的时刻。新的 AI 技术和迅速蔓延的应用正在改变科学和各行各业,并为成千上万的新公司开辟新的疆域。这将是我们迄今为止最重要的一次 GTC。” 在演讲中,黄仁勋首先分享了英伟达数据中心以及全栈加速计算平台CUDA的新进展——在黄仁勋看来,加速计算是减少功耗、实现可持续发展和排放清零的最好方式。 今年,英伟达对100个加速库和AI模型进行了更新,并开辟了新的应用场景。比如在汽车和航空航天行业,CFD(计算流体力学)被应用于气流的仿真。使用CUDA对CFD求解器进行加速后,英伟达A100芯片的吞吐量是同等系统成本下CPU服务器的9倍。 其次,英伟达推出了与以色列量子计算公司Quantum Machines合作开发的一款量子控制链路。这一链路可将英伟达GPU接入量子计算机,并以极快的速度实现纠错。 与此同时,英伟达在今年将推出新的向量数据库:RAFT。向量数据库的重要作用是为推荐系统提供存储、索引、搜索和检索费结构化数据的大型数据集。RAFT在此基础上,还具有加速索引、数据加载和近邻检索等功能。黄仁勋认为:“对于自研大型语言模型的组织而言,向量数据库至关重要。” 针对深度学习推理平台(NVIDIA Deep Learning AI),英伟达则发布了一系列新功能:支持集成模型的模型分析器、并发多模型服务,以及适用于GPT-3大模型的多GPU、多节点推理。 随着算法的复杂化,计算光刻技术也在快速演进。在演讲中,黄仁勋宣布推出计算光刻库cuLitho。据他介绍,cuLitho是一项耗时4年的庞大项目。通过与台积电、ASML和Synopsys三家芯片制造厂商合作,cuLitho将计算光刻的速度提升了40倍以上。 为了拥抱AI大模型时代的到来,英伟达在云服务上也有不小动作。 首先,英伟达与微软Azure、Google GCP和Oracle OCI三家云厂商合作推出了NVIDIA DGX Cloud。通过一个浏览器,客户就可以将英伟达DGX AI超级计算机实时接入公司。 其次,面向具有构建、优化和运营定制大语言模型和生成式AI需求的客户,英伟达推出云服务NVIDIA AI Foundations,提供语言、数据和生物学模型的定制服务。比如,英伟达与Adobe已经进行合作,将生成式AI融入营销和创意工作者的工作流程中。 同时,针对ChatGPT等大语言模型的推理训练,英伟达推出了新的GPU H100。H100配备有94GB HBM3的显存,可以支持参数规模达到1750亿的GPT-3,并将大语言模型的处理成本降低一个数量级。 此外,针对生物制药、自动驾驶等细分领域,英伟达也推出了相应的服务。 “我们正处于AI的‘iPhone’时刻。”在演讲中,黄仁勋将这句话强调了两次。他总结:“初创公司竞相构建具有颠覆性的产品和商业模式,而老牌公司则在寻求应对之法——生成式AI引发了全球企业制定AI战略的紧迫感。”在为AI浪潮下的企业提供解法的同时,不甘缺席技术浪潮的英伟达或许也在寻找自己的解法。 |