【直播预告】模型训练到全栈协同：AI算力与存储最佳实践-数据猿的专栏

【直播预告】模型训练到全栈协同：AI算力与存储最佳实践

2026-06-12 18:30:27栏目：默认栏目 IP属地：IP未知

“6月16日（周二）14：00正式开始！

大模型参数竞赛渐入冷静期，但AI产业真正的攻坚战才刚刚开始。

过去两年，行业目光高度集中于算法突破与算力堆叠。然而，当万卡集群逐渐成为头部企业的标配，一个更本质的问题浮出水面：算力堆上去了，数据真的搬得动吗？现实并不乐观。

·训练任务中，GPU因等待数据而空转的现象依然普遍；

·Checkpoint写入延迟，直接拉长大模型迭代周期；

·推理侧成本高企，根因往往不是显卡价格，而是数据存储架构的“历史包袱”。

这说明一个关键事实：算力决定上限，存力决定下限。在AI从“训练驱动”走向“推理驱动”的转折点上，存算协同不再是锦上添花，而是效率突围的必由之路。

从具身智能的VLA模型预训练，到自动驾驶的世界模型仿真——每一个前沿场景，都在倒逼基础设施完成一次底层跃迁：

·算力集群不能单纯依据规模数量评估实际效能，而是要验证选定的RDMA协议、低延迟网络拓扑架构，是否匹配实际应用场景，核心便是评估组网带宽与存储带宽，能否满足大规模分布式训练时的超大算力吞吐与数据传输；

·存储选型不能只比性能和容量，还需要看存储系统整体TCO，PB级数据存储如何在降本增效的基础上满足Checkpoint数据读写的I/O需求

·架构演进不能只谈存算分离，而要看分离之后如何实现真正的联合优化。

这些，正是当前AI基础设施领域最硬核、也最容易被忽视的工程命题。

6月16日14:00，数据猿联合西部数据与宽恒科技，邀请两位长期身处一线、亲手操盘过万卡集群与大规模存储系统的技术专家，展开一场不绕弯、不空谈、只讲实战的深度对话。

本次线上直播论道中，就以下热点展开讨论：

❶ 大模型与前沿AI应用对AI基础设施的根本性挑战

❷ 算力底座的深度实践——从集群设计到模型调优

❸ 存储技术的硬核突破——从HDD创新技术帮助客户降低TCO的角度谈（SMR技术、双枢轴技术等）高性能HDD与存算分离平台

❹ 算力与存力的全栈协同——如何实现真正的联合优化

➎ 产业机遇与市场前景——新赛道与新格局

芦浩丨西部数据资深售前工程师

西部数据资深技术专家，拥有超过20年的存储技术领域深耕经验，并在西部数据公司任职十余年。他精通硬盘存储技术，擅长结合用户的具体需求设计高效、可靠的存储解决方案，尤其在性能优化和故障诊断方面积累了丰富的实战经验。

在工作中，他始终以用户需求为核心，专注于解决存储技术中的实际问题，帮助客户提升存储系统的性能和可靠性。无论是面对传统存储挑战，还是新兴技术的探索，芦浩始终以实际效果为目标，为客户提供真正有价值的存储解决方案。

芦浩曾多次受邀出席全球存储行业峰会，并作为嘉宾分享他在存储技术领域的独到见解与创新成果。他的演讲内容不仅涵盖传统硬盘技术，还深入探讨了新兴存储介质的前沿发展，为行业提供了宝贵的经验和技术指导。

温锦辉丨宽恒科技高级E2E解决方案工程师

拥有7年人工智能算法研发经验，曾深度参与多个商用AI产品的研发，擅长机器学习、计算机视觉、大语言模型应用、多模态大模型等技术领域。当前聚焦于具身智能与自动驾驶领域的解决方案技术支持，具备端到端架构、VLA模型、世界模型等行业前沿技术方向的深度研究实例。

曾受邀参与多次具身智能/自动驾驶领域技术研讨峰会，分享对应模型训练平台+Infra最佳实践方案，为产业输出基于NVIDIA AI生态底座的算力集群架构设计与交付部署方案，推动行业模型及算法的持续迭代进化、缩短产业大规模落地进程。

张艳飞丨数据猿联合创始人兼主编

张艳飞，拥有10多年的科技互联网行业媒体从业经历，曾在艾瑞、网易等知名企业负责媒体内容及运营层面的工作，并于2015年联合创立数据智能产业创新服务媒体——数据猿。

张艳飞曾获腾讯云社区优秀讲师、科特勒咨询集团荣誉顾问、大中华区艾菲奖实效观察员等荣誉，在大数据、人工智能、云计算等新技术领域，以及数字营销、金融科技、工业互联网、智能制造等领域均拥有丰富的第三方机构及媒体从业经验。