首页 > 生活知识 > 每天学习 > 后训练时代,联想如何搭建算力赛道的“超级枢纽”?

后训练时代,联想如何搭建算力赛道的“超级枢纽”?

发布时间:2025-05-21 22:13:03来源: 15699338890

从ChatGPT掀起全民AI热潮,到DeepSeek、千问3等本土大模型接连崛起,算力早已超越传统硬件范畴,成为国家战略竞争的新制高点。据中国信息通信研究院发布的《中国算力发展指数白皮书(2022 年)》显示,预计到2030年,全球算力规模将达到56 ZFLOPS,年平均增长率为65%。

在这场算力争夺战中,联想作为行业重要参与者,正通过一系列创新举措构建自身竞争优势。

近日,联想以2025创新科技大会为舞台,在联想AI算力基础设施技术创新论坛暨春季新品发布会上,推出六大创新技术与两大重磅升级,正式推出堪称“算力矩阵”的重磅武器——联想万全异构智算平台3.0、全新算力服务器家族、联想凌拓全新存储产品家族和针对多种规模构建的AI算力集群的智能网络体系以及创新技术与产品,并升级AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本


我们好奇,随着大模型规模的不断扩展、应用场景的日益复杂,AI算力基础设施行业面临哪些挑战?联想新发布的联想万全异构智算平台3.0以及服务器产品实力如何,能否应对挑战?未来,联想在服务器及智算平台这两个赛道又将有怎样的战略规划与布局?

AI浪潮下,算力基础设施面临五大挑战

IT基础设施作为算力的物质基础和核心载体,在行业数字化发展的各个方面都起着不可或缺的作用。如今,随着以DeepSeek为代表的开源大模型走进千行百业,算力基础设施面临新挑战。

第一,算力需求多样化。从基础模型的预训练到推理模型、多模态模型的应用,以及从简单的对话机器人到AI Agent、具身智能的发展,对服务器等设施算力需求也变得更加多样化,这就要求算力基础设施能够提供预训练算力、训推算力、推理算力等更全面多样的AI算力。

第二,算力基础设施需要更高性能。模型本地部署的应用潮流,对大模型一体机的单机性能提出了极致要求,需要服务器具备更强的计算能力、更高的存储容量和更快的读写速度,以满足本地模型的高效运行。


同时,万卡、十万卡级算力集群的出现,要求在超大规模算力集群里,实现“算存网”能力的高效协同,以避免因某一环节的性能瓶颈而影响整个集群的算力发挥。

第三,算力基础设施需要更高能效。AI算力的增长对电力需求提出了更多挑战,如何在满足算力需求的同时,降低数据中心的能耗,实现绿色计算,是服务器及算力基础设施面临的重要问题。

第四,算力基础设施需要更高可靠性。在AI计算中,尤其是大规模的分布式训推过程中,硬件故障可能导致整个集群计算水平大幅度下降。这就要求算力基础设施具备更高的硬件可靠性和故障自愈能力。

第五,算力基础设施需要提高通信效率。以DeepSeek为代表的MoE架构大模型,在训推过程中的通信复杂度呈指数级增长,与传统的稠密模型相比,各个专家间需要不断地通信、协同计算,导致多个GPU间频繁交互,这对AI服务器之间的通信网络提出了更高的要求。

技术突围!联想两大利器破解算力困局

如何破解大模型时代算力基础设施面临的诸多挑战?在联想看来,唯有创新才是破解挑战的唯一选择。

回首过去,当行业面临大模型预训练和传统模型推理的算力诉求时,联想通过技术创新,推出联想万全异构智算平台四大技术,筑牢大模型发展底座。

如今,联想依旧以创新为引领,打造大模型时代的坚实底座,在本次大会上推出联想万全异构智算平台3.0与全新算力服务器家族两大核心“利器”。

利器一:发布联想万全异构智算平台3.0

联想中国基础设施业务群战略管理部总监黄山表示,联想万全异构智算平台3.0进一步推出五大差异化技术,帮助用户在AI预训练、后训练、推理的过程中取得最高效、最稳定的算力。具体而言,五大技术将带来算力设施如下升级。

其一,AI推理加速算法集,可对MLA等业界新型方法进行工程实践落地,并结合联想积累的混合精度量化、分布式并行等方法二次优化,将DeepSeek等大模型的推理性能提升5-10倍,单台8卡GPU服务器采用该平台后可支持190路用户同时使用DeepSeek满血版,相比业界最优社区方案保持20%性能优势,满足用户对推理高吞吐量、低延时的诉求。

其二,AI编译优化器,能在构建AI计算图过程中,采用临近算子融合、高效算子替代和简化计算路径等方式,结合与GPU战略伙伴的研发成果优化算子,经其优化后,AI训练后推理的计算开销至少降低15%,且分布式训练或推理规模越大,效果越显著。

其三,AI训推慢节点故障预测与自愈系统,基于联想三年以上积累的AI训推故障特征库并训练故障预测模型,实现用AI模型预测AI故障。系统通过异步训练检查点或推理备份准备故障恢复环境,故障发生时自动排除故障点,实现百卡集群故障秒级恢复、千卡分钟级恢复、万卡十分钟级以内恢复。

其四,专家并行通信算法,针对MoE架构大模型训推中all to all通信方式带来的指数级通信复杂度问题,研发细粒度的计算通信协同优化算法,在底层核函数层面实现计算与通信过程高度并行,将推理延迟降低300%以上,网络带宽利用率从50%提升到90%。

其五,智能资源调度引擎,可基于实时负载感知与异构算力特征,动态优化GPU/CPU/DPU等资源分配策略。通过拓扑感知的任务调度算法,将多模态模型训推任务与硬件架构精准匹配,使混合算力集群利用率提升25%以上,端到端任务执行效率提高30%,全面释放异构算力潜能。

利器二:全新算力服务器家族

联想中国基础设施业务群服务器产品部总经理周韬在发布会上指出,联想在服务器发展中一直通过引领服务器技术创新,为客户重新定义新的算力。如今,面对大模型后训练时代,联想选择再次进化服务器,并重新定义算力。本次联想推出的全新算力服务器家族,可面对不同AI应用场景,充分释放AI服务器的算力潜能。

每天学习更多>>

谷歌承认 Instagram 应用在安卓手机上耗电异常,已推新版本解决 微软Teams Free全面升级,取代Skype开启协作新篇章 贵州下司犬火遍全网,今日17点,动静带你探秘“狗界顶流” “丝路电商”国际合作对接会:布达佩斯海外仓等8个项目签约 全国最大京东MALL落地北京南中轴 天猫618国补品类成交暴涨283%:小米小家电第一、大家电前三 天猫精灵发布全屋智能2.0,以通义大模型为基座 端午楼市之荔湾区:总价500万元以下新房选择多成交多 惠州全面推广房票政策 楼市需求或见涨 读懂楼市“领头雁”,就是读懂广州的未来 重磅!杭州链家推出“扰一赔百元”承诺,重塑房产经纪服务新标杆 苹果计划将iOS19改名iOS26:一场版本号的“阳谋”与生态博弈 曝iPhone 17 Pro采用拼接材质:苹果史上变化最大的手机 vivo S30系列发布,含S30和S30 Pro mini两款,国补价2294.15元起 被vivo S30系列发布会圈粉!细节控狂喜的神仙设计 vivo X Fold 5和荣耀Magic V5参数曝光 预计下月发布 曝荣耀300系列已累计销售超250万部 上市至今仅半年 2%电量焦虑催生充电宝依赖,荣耀7200毫安电池缓解危机 苹果iOS 26将新增锁屏充电时间显示功能 消息称小米还有一个旗舰平板,换装 12.5 英寸 LCD 屏 鸿道具身智能机器人操作系统发布 首创大小脑融合机器人电子架构 四川成都:机器人非遗节上“秀”功夫茶技艺 “种草直达”+“友好市集”,小红书探索电商新解法 “苏青联动:洪泽湖大闸蟹&祁连藏羊澳门行暨2025青海跨境电商交流会”成功举行 德国坦克电容麦悬臂支架 天猫直降54元 三星Galaxy VS 苹果iPhone:谁家用户谁赚得更多? CounterPoint 报告 2025Q1 印度手机出货量:vivo 22% 连续 3 个季度领跑 天易金霞小学:绿茵“雏凤”展锋芒 荣耀背后共担当 POLYGON手机计步器电筒MP3防丢绳挂绳促销 Counterpoint Research:2025年Q1中东和非洲智能手机出货量同比增长7%