【直播预告】模型训练到全栈协同:AI算力与存储最佳实践
2026-06-12 18:30:27
  • 0
  • 0
  • 0

“6月16日(周二)14:00正式开始!

大模型参数竞赛渐入冷静期,但AI产业真正的攻坚战才刚刚开始。

过去两年,行业目光高度集中于算法突破与算力堆叠。然而,当万卡集群逐渐成为头部企业的标配,一个更本质的问题浮出水面:算力堆上去了,数据真的搬得动吗?现实并不乐观。

·训练任务中,GPU因等待数据而空转的现象依然普遍;

·Checkpoint写入延迟,直接拉长大模型迭代周期;

·推理侧成本高企,根因往往不是显卡价格,而是数据存储架构的“历史包袱”。

这说明一个关键事实:算力决定上限,存力决定下限。 在AI从“训练驱动”走向“推理驱动”的转折点上,存算协同不再是锦上添花,而是效率突围的必由之路。

从具身智能的VLA模型预训练,到自动驾驶的世界模型仿真——每一个前沿场景,都在倒逼基础设施完成一次底层跃迁:

·算力集群不能单纯依据规模数量评估实际效能,而是要验证选定的RDMA协议、低延迟网络拓扑架构,是否匹配实际应用场景,核心便是评估组网带宽与存储带宽,能否满足大规模分布式训练时的超大算力吞吐与数据传输;

·存储选型不能只比性能和容量,还需要看存储系统整体TCO,PB级数据存储如何在降本增效的基础上满足Checkpoint数据读写的I/O需求

·架构演进不能只谈存算分离,而要看分离之后如何实现真正的联合优化。

这些,正是当前AI基础设施领域最硬核、也最容易被忽视的工程命题。

6月16日14:00,数据猿联合西部数据与宽恒科技,邀请两位长期身处一线、亲手操盘过万卡集群与大规模存储系统的技术专家,展开一场不绕弯、不空谈、只讲实战的深度对话。

直播话题讨论

本次线上直播论道中,就以下热点展开讨论:

❶ 大模型与前沿AI应用对AI基础设施的根本性挑战

❷ 算力底座的深度实践——从集群设计到模型调优

❸ 存储技术的硬核突破——从HDD创新技术帮助客户降低TCO的角度谈(SMR技术、双枢轴技术等) 高性能HDD与存算分离平台

❹ 算力与存力的全栈协同——如何实现真正的联合优化

➎ 产业机遇与市场前景——新赛道与新格局

直播嘉宾介绍

芦浩丨西部数据 资深售前工程师

西部数据资深技术专家,拥有超过20年的存储技术领域深耕经验,并在西部数据公司任职十余年。他精通硬盘存储技术,擅长结合用户的具体需求设计高效、可靠的存储解决方案,尤其在性能优化和故障诊断方面积累了丰富的实战经验。

在工作中,他始终以用户需求为核心,专注于解决存储技术中的实际问题,帮助客户提升存储系统的性能和可靠性。无论是面对传统存储挑战,还是新兴技术的探索,芦浩始终以实际效果为目标,为客户提供真正有价值的存储解决方案。

芦浩曾多次受邀出席全球存储行业峰会,并作为嘉宾分享他在存储技术领域的独到见解与创新成果。他的演讲内容不仅涵盖传统硬盘技术,还深入探讨了新兴存储介质的前沿发展,为行业提供了宝贵的经验和技术指导。

温锦辉丨宽恒科技 高级E2E解决方案工程师

拥有7年人工智能算法研发经验,曾深度参与多个商用AI产品的研发,擅长机器学习、计算机视觉、大语言模型应用、多模态大模型等技术领域。当前聚焦于具身智能与自动驾驶领域的解决方案技术支持,具备端到端架构、VLA模型、世界模型等行业前沿技术方向的深度研究实例。

曾受邀参与多次具身智能/自动驾驶领域技术研讨峰会,分享对应模型训练平台+Infra最佳实践方案,为产业输出基于NVIDIA AI生态底座的算力集群架构设计与交付部署方案,推动行业模型及算法的持续迭代进化、缩短产业大规模落地进程。

张艳飞丨数据猿 联合创始人兼主编

张艳飞,拥有10多年的科技互联网行业媒体从业经历,曾在艾瑞、网易等知名企业负责媒体内容及运营层面的工作,并于2015年联合创立数据智能产业创新服务媒体——数据猿。

张艳飞曾获腾讯云社区优秀讲师、科特勒咨询集团荣誉顾问、大中华区艾菲奖实效观察员等荣誉,在大数据、人工智能、云计算等新技术领域,以及数字营销、金融科技、工业互联网、智能制造等领域均拥有丰富的第三方机构及媒体从业经验。

 
最新文章
相关阅读