从2023年9月开始,HPN7.0在阿里云展开大规模部署,大模型训练性能较上一代架构在典型场景下提升14.9%,且大幅提高了智算网络整体稳定性。前不久阿里云发布通义千问2.5版本大模型,就是基于HPN7.0高性能网络架构训练。通义千问2.5版本较2.1版本在理解能力、逻辑推理、指令遵循、代码能力上分别提升9%、16%、19%、10%,中文性能全面赶超GPT-4Turbo。
大模型的火热对AI基础设施提出了更高要求,HPN7.0架构即面向AI时代对网络高性能需求而研发。据介绍,HPN7.0针对大模型训练场景下规模大、大流多、突发强烈、稳定性需求高的特点,创新性地设计了“双上联+多轨+双平面”的网络架构,并配合最新一代的51.2Tbps单芯片以太网交换机和400G高性能网卡,自研Solar-RDMA和ACCL通信库,实现了单层千卡、两层万卡的高性能和高稳定互联。
网络架构是网络技术及系统的基石,重大创新如连城之璧般稀少。据了解,SIGCOMM此前关于传统数据中心网络的架构领域文章还是Google提出的Jupiter网络,现已成为业界经典网络架构范式。有专家指出,此次由阿里云提出的新一代网络架构HPN7.0,有望成为下一代AI高性能网络架构的新范式。
王多鱼打卜克网站免费下载安装官网【环球网科技综合报道】5月13日,网络通信领域国际顶会SIGCOMM2024确定了收录论文名单,中国企业表现亮眼,阿里云6篇论文入选,其中,介绍阿里云最新一代的智算集群网络架构HPN7.0的成果论文,成为SIGCOMM历史上在AI智算集群网络架构领域的首篇论文。据了解,SIGCOMM2024将于8月在悉尼线下召开会议。
在SIGCOMM近50年的发展历程中,来自中国大陆的论文仅50余篇,其中阿里累计入选25篇,是国内被收录数量最多的科技公司。据了解,阿里云在高性能网络领域已深耕多年,提出了端网融合的可预期网络技术体系,并在业界率先实践完成RDMA低延时网络、智算集群网络架构HPN7.0等先进网络技术的大规模实践。阿里巴巴还曾获评权威机构AMiner全球十大最具影响力的网络研究机构。
阿里云基础设施网络负责人蔡德忠介绍称:“阿里云从2017年开始探索端网融合的可预期网络,HPN7.0更进一步,把端网融合的体系结构从网络协议栈拓展到网络架构和通信库,实现了面向AI智算时代的全新网络集群架构创新。”
274.88MB
查看405.20MB
查看25.9MB
查看280.15MB
查看
网友评论更多
24 延安j
天价外援爆发!5000万欧标王处子球 拉米打爆全北🛅🛋
2025-06-16 13:27:27 推荐
187****3064 回复 184****5544 :恒大战悉尼获利好:两主力受伤 对手一个多月没赢球🛍 来自铜川
187****6307 回复 184****8180 :韩媒被打怕了?称水原打上港很艰苦 连全北都输了🛎 来自渭南
157****9098 :按最下面的历史版本🛏🛐 来自咸阳
23 宝鸡782
NBA修改库里KO雷霆绝杀球距离 给跪了!竟超过11米🛑🛒
2025-06-15 00:45:16 推荐
永久VIP :亚冠-塔神建功赵明剑神仙球 鲁能3-0武里南2连胜🛠 来自汉中
158****3425 :赔率看衰恒大取胜 澳媒仍恭维:亚洲巨人来了🛡 来自榆林
158****6745 回复 666🛢 :重磅!英媒曝英超五豪门巨头密会 集体放弃欧冠🛣 来自商洛
34 安康zt
独家评论:七年后再创一个奇迹是北京未来选择🛤🛥
2025-06-14 08:52:18 不推荐
韩城yy :佩帅:三大外援发挥出色 崔康熙:回主场定赢苏宁🛩
186****7381 回复 159****5886 :嗨爆!吴曦摇篮舞有多贵?全场球迷为吉翔庆生(gif)🛫