后训练时代，联想如何搭建算力赛道的“超级枢纽”？

从ChatGPT掀起全民AI热潮，到DeepSeek、千问3等本土大模型接连崛起，算力早已超越传统硬件范畴，成为国家战略竞争的新制高点。据中国信息通信研究院发布的《中国算力发展指数白皮书（2022 年）》显示，预计到2030年，全球算力规模将达到56 ZFLOPS，年平均增长率为65%。

在这场算力争夺战中，联想作为行业重要参与者，正通过一系列创新举措构建自身竞争优势。

近日，联想以2025创新科技大会为舞台，在联想AI算力基础设施技术创新论坛暨春季新品发布会上，推出六大创新技术与两大重磅升级，正式推出堪称“算力矩阵”的重磅武器——联想万全异构智算平台3.0、全新算力服务器家族、联想凌拓全新存储产品家族和针对多种规模构建的AI算力集群的智能网络体系以及创新技术与产品，并升级AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本

我们好奇，随着大模型规模的不断扩展、应用场景的日益复杂，AI算力基础设施行业面临哪些挑战？联想新发布的联想万全异构智算平台3.0以及服务器产品实力如何，能否应对挑战？未来，联想在服务器及智算平台这两个赛道又将有怎样的战略规划与布局？

AI浪潮下，算力基础设施面临五大挑战

IT基础设施作为算力的物质基础和核心载体，在行业数字化发展的各个方面都起着不可或缺的作用。如今，随着以DeepSeek为代表的开源大模型走进千行百业，算力基础设施面临新挑战。

第一，算力需求多样化。从基础模型的预训练到推理模型、多模态模型的应用，以及从简单的对话机器人到AI Agent、具身智能的发展，对服务器等设施算力需求也变得更加多样化，这就要求算力基础设施能够提供预训练算力、训推算力、推理算力等更全面多样的AI算力。

第二，算力基础设施需要更高性能。模型本地部署的应用潮流，对大模型一体机的单机性能提出了极致要求，需要服务器具备更强的计算能力、更高的存储容量和更快的读写速度，以满足本地模型的高效运行。

同时，万卡、十万卡级算力集群的出现，要求在超大规模算力集群里，实现“算存网”能力的高效协同，以避免因某一环节的性能瓶颈而影响整个集群的算力发挥。

第三，算力基础设施需要更高能效。AI算力的增长对电力需求提出了更多挑战，如何在满足算力需求的同时，降低数据中心的能耗，实现绿色计算，是服务器及算力基础设施面临的重要问题。

第四，算力基础设施需要更高可靠性。在AI计算中，尤其是大规模的分布式训推过程中，硬件故障可能导致整个集群计算水平大幅度下降。这就要求算力基础设施具备更高的硬件可靠性和故障自愈能力。

第五，算力基础设施需要提高通信效率。以DeepSeek为代表的MoE架构大模型，在训推过程中的通信复杂度呈指数级增长，与传统的稠密模型相比，各个专家间需要不断地通信、协同计算，导致多个GPU间频繁交互，这对AI服务器之间的通信网络提出了更高的要求。

技术突围！联想两大利器破解算力困局

如何破解大模型时代算力基础设施面临的诸多挑战？在联想看来，唯有创新才是破解挑战的唯一选择。

回首过去，当行业面临大模型预训练和传统模型推理的算力诉求时，联想通过技术创新，推出联想万全异构智算平台四大技术，筑牢大模型发展底座。

如今，联想依旧以创新为引领，打造大模型时代的坚实底座，在本次大会上推出联想万全异构智算平台3.0与全新算力服务器家族两大核心“利器”。

利器一：发布联想万全异构智算平台3.0

联想中国基础设施业务群战略管理部总监黄山表示，联想万全异构智算平台3.0进一步推出五大差异化技术，帮助用户在AI预训练、后训练、推理的过程中取得最高效、最稳定的算力。具体而言，五大技术将带来算力设施如下升级。

其一，AI推理加速算法集，可对MLA等业界新型方法进行工程实践落地，并结合联想积累的混合精度量化、分布式并行等方法二次优化，将DeepSeek等大模型的推理性能提升5-10倍，单台8卡GPU服务器采用该平台后可支持190路用户同时使用DeepSeek满血版，相比业界最优社区方案保持20%性能优势，满足用户对推理高吞吐量、低延时的诉求。

其二，AI编译优化器，能在构建AI计算图过程中，采用临近算子融合、高效算子替代和简化计算路径等方式，结合与GPU战略伙伴的研发成果优化算子，经其优化后，AI训练后推理的计算开销至少降低15%，且分布式训练或推理规模越大，效果越显著。

其三，AI训推慢节点故障预测与自愈系统，基于联想三年以上积累的AI训推故障特征库并训练故障预测模型，实现用AI模型预测AI故障。系统通过异步训练检查点或推理备份准备故障恢复环境，故障发生时自动排除故障点，实现百卡集群故障秒级恢复、千卡分钟级恢复、万卡十分钟级以内恢复。

其四，专家并行通信算法，针对MoE架构大模型训推中all to all通信方式带来的指数级通信复杂度问题，研发细粒度的计算通信协同优化算法，在底层核函数层面实现计算与通信过程高度并行，将推理延迟降低300%以上，网络带宽利用率从50%提升到90%。

其五，智能资源调度引擎，可基于实时负载感知与异构算力特征，动态优化GPU/CPU/DPU等资源分配策略。通过拓扑感知的任务调度算法，将多模态模型训推任务与硬件架构精准匹配，使混合算力集群利用率提升25%以上，端到端任务执行效率提高30%，全面释放异构算力潜能。

利器二：全新算力服务器家族

联想中国基础设施业务群服务器产品部总经理周韬在发布会上指出，联想在服务器发展中一直通过引领服务器技术创新，为客户重新定义新的算力。如今，面对大模型后训练时代，联想选择再次进化服务器，并重新定义算力。本次联想推出的全新算力服务器家族，可面对不同AI应用场景，充分释放AI服务器的算力潜能。

后训练时代，联想如何搭建算力赛道的“超级枢纽”？

每天学习更多>>