
体来说,ZCube通过“单轨+多轨”混合接入的独特拓扑设计,确保全网任意两张GPU之间有且仅有一条最优路径,从架构层面实现全网交换机的理想负载均衡。 实测中,智谱将ZCube投入在千卡级GLM-5.1的一个线上推理集群中,在GPU型号、软件栈、业务代码全部不变的前提下,仅升级网络架构。 对比测试结果显示,在当前算力紧缺的背景下,使用同样的算力,ZCube架构每秒可多服务15%的用户请求。智谱技
当前文章:https://www.h5tg.com/s0f/vpujy.htm
发布时间:00:34:21
关于我们 | 蜘蛛资讯网 版权所有
Copyright ? 2019 蜘蛛资讯网 All Rights Reserved