名奢网 名表 最新资讯 查看内容

浪潮AI效劳器再创MLPerf V2.0锻炼评测最佳成果

2022-12-10 13:45| 发布者: 挖安琥| 查看: 135| 评论: 0

放大 缩小
简介:6月30日,全球权威AI基准评测MLPerf最新V2.0锻炼评测成果榜单发布。浪潮AI效劳器表示优秀,继两月前在MLPerfV2.0数据中心推理评测中斩获全部冠军后,本次又在MLPerfV2.0单机锻炼性能继续坚持抢先。本次MLPerf评测吸 ...

6月30日,全球权威AI基准评测MLPerf最新V2.0锻炼评测成果榜单发布。浪潮AI效劳器表示优秀,继两月前在MLPerfV2.0数据中心推理评测中斩获全部冠军后,本次又在MLPerfV2.0单机锻炼性能继续坚持抢先。


本次MLPerf评测吸收了包含谷歌、NVIDIA、浪潮信息、百度、Intel-Habana、Graphcore等全球21家厂商和研讨机构参与,共有264项评测成果提交,是上一轮基准评测的1.5倍。评测任务涵盖了当下主流AI场景,包含自然言语处置(BERT)、智能引荐(DLRM)、图像分类(ResNet)、医学影像分割(3D U-Net)、轻量级目的物体检测(RetinaNet)、重量级目的物体检测(Mask R-CNN)、语音辨认(RNN-T)以及强化学习(Minigo)8类AI任务。


在单机锻炼评测的固定任务中,浪潮信息以高端AI效劳器斩获自然言语了解(BERT)、智能引荐(DLRM)、语音辨认(RNN-T)三项性能成果第一,位列单机冠军榜首。在本次配置8颗NVIDIA A100 Tensor Core GPU的主流高端AI效劳器中,浪潮AI效劳器斩获5项任务最佳成果(BERT、DLRM、RNN-T、ResNet、MaskR-CNN)。


超越摩尔定律,持续领跑AI计算性能提升


MLPerfTM评测组织机构MLCommons 执行主任David Kanter 在此次成果发布会上表示,自初次发布评测基准以来,MLPerf性能提升速度远超越摩尔定律。思索到业界对计算和AI的需求正以惊人的速度增长,这让人十分振奋。


自参与MLPerfAI性能评测以来,浪潮AI效劳器经过软硬件全面优化,持续完成AI性能突破。相较于2018年12月MLPerf 初始版本V0.5的典型配置8卡机型的性能数据,浪潮AI效劳器的性能显现出大幅提升,提升比例最高达789%,2.35倍于摩尔定律增速。

浪潮AI效劳器再创MLPerf V2.0锻炼评测最佳成果


浪潮AI效劳器在MLPerf基准评测中的杰出表示,得益于浪潮信息在AI计算系统上优秀的设计创新才干和全栈优化才干。浪潮AI效劳器针对AI锻炼中常见的密集I/O传输瓶颈,经过PCIe retimer-free 设计完成了CPU-GPU间通道免中继高速互联,大幅降低通讯延迟;并针对高负载多GPU协同任务调度,以及NUMA节点与GPU之间的数据传输性能中止了深度优化,确保锻炼任务中的数据I/O通路处于最高性能状态;在散热层面,率先完成4U空间内部署8颗500W的高端NVIDIA A100 TensorCoreGPU,并支持风冷、液冷两种散热方式。同时,在模型锻炼全流程中,浪潮AI效劳器持续经过优化预锻炼数据处置、GPU之间高速通讯、GPU中心加速等关键模块,最大化提升了AI模型的锻炼性能。


大幅提升Transformer锻炼性能


当前,基于Transformer神经网络的预锻炼大模型正引领新一代AI算法展开,并逐步从自然言语处置走向计算机视觉、多模态等范畴。MLPerfTM评测任务中的BERT模型即是基于Transformer架构的模型。Transformer简约、可堆叠的架构使得开发极大参数量、基于极大数据集的预锻炼大模型成为可能,这带来了模型算法才干的大幅提升,但同时也对AI计算系统的处置性能、通讯互联、I/O性能、并行扩展、拓扑途径及散热才干提出了更高的请求。


在本次BERT评测任务中,浪潮AI效劳器经过优化数据预处置、GPU之间密集参数通讯、超参数自动寻劣等,进一步提升了BERT锻炼性能,在15.869分钟内即在Wikipedia数据集的2850176条数据上完成了3.3亿参数的BERT模型锻炼,相较于V0.7版本的最佳成果49.01分钟的性能提升抵达309%。至此,浪潮AI效劳器曾经连续三次取得MLPerfTM锻炼BERT任务性能冠军。

浪潮AI效劳器再创MLPerf V2.0锻炼评测最佳成果


浪潮信息在MLPerf V2.0锻炼评测中取得佳绩的2款AI效劳器分别是NF5488A5及NF5688M6。NF5488A5是全球首批上市的NVIDIA A100 Tensor Core GPU效劳器,在4U空间支持8颗由NVIDIA NVLink 互联的NVIDIA A100 Tensor Core GPU和2颗AMD Milan CPU,同时支持液冷微风冷散热技术,累计斩获40项 MLPerf 冠军。NF5688M6是面向大范围数据中心优化设计的具备极致扩展才干的AI效劳器,支持8颗第三代 NVLink 互联的NVIDIA A100 Tensor Core GPU 和两颗Intel Ice Lake CPU,支持多达13张PCIe Gen4 的IO扩展才干,累计斩获25项 MLPerf 冠军。


附:MLPerf简介


MLPerf 是影响力最广的国际AI性能基准评测,由图灵奖得主大卫帕特森(David Patterson)分离顶尖学术机构发起成立。2020年,非盈利性机器学习开放组织MLCommons基于MLPerf 基准测试成立,其成员包含Google、Facebook、NVIDIA、英特尔、浪潮信息、哈佛大学、斯坦福大学、加州大学伯克利分校等50余家全球AI领军企业及顶尖学术机构,努力于推进机器学习和人工智能规范及权衡指标。目前,MLCommons每年组织2次MLPerf AI锻炼性能测试和2次MLPerfAI推理性能测试,以便快速跟进疾速变更的计算需求和计算性能提升,为用户权衡设备性能提供权威有效的数据指导。



路过

雷人

握手

鲜花

鸡蛋
已有 0 人参与

会员评论

最新文章

文章列表

 名表回收网手机版

官网微博:名表回收网服务平台

今日头条二维码 1 微信公众号二维码 1 抖音小程序二维码 1
浙江速典奢贸易有限公司 网站经营许可证 备案号:浙ICP备19051835号2012-2022
名表回收网主要专注于手表回收,二手名表回收/销售业务,可免费鉴定(手表真假),评估手表回收价格,正规手表回收公司,浙江实体店,支持全国范围上门回收手表
返回顶部