对话袋鼠云拖雷:Data+AI的“智能飞轮”,如何释放场景价值? | 数据猿专访
2026-05-25 21:02:17
  • 0
  • 0
  • 0

“企业AI落地的真相,和你想的不一样。

AI很火,这谁都知道。

2026年刚过去不到半年,Agentic AI、OpenClaw、Harness……新概念一个接一个往外冒。企业纷纷试水,各种Demo和PoC项目遍地开花。资本市场更是热情高涨,只要和AI沾边,估值就能翻几番。

但热闹背后,另一组数据却不太好看。

瑞银2026年5月发布的一份调查报告揭示了一个尴尬的现实:截至今年3月,只有19%的企业实现了AI的“规模化生产部署”,两年前这个数字是10%。更值得注意的是,一年前有84%的企业预期自己能在12个月内完成规模化部署,但实际上只有5%做到了。这种系统性乐观偏差在每轮调查中都在出现,而且差距还在持续扩大。

Gartner的数据同样触目惊心:相当比例的生成式AI项目在PoC后被放弃,原因集中在数据质量、风险控制、成本和业务价值不清。Gartner还预测,到2026年,60%没有AI-Ready数据支撑的AI项目将被放弃。

技术的进化是指数级的,但企业落地的速度是线性的。落差正在扩大。

就在这样的背景下,2026年5月14日,袋鼠云以“数序重构·智启新生”为主题,举办了十周年春季数智发布会。会上,袋鼠云正式发布了“Data+AI智能飞轮”战略,同时宣布核心产品“数栈”升级到V7.0,定位为“多模态数据智能平台”。

那么,袋鼠云是如何看待市场发展,又是如何做的?为了回答这个问题,数据猿专访了袋鼠云董事长陈吉平(花名“拖雷”)。他既是阿里系数据老兵——曾参与阿里第一代大数据平台建设,也是中国最早一批大数据创业者的代表。从2015年创办袋鼠云至今,他亲历了数据产业从“建数仓”到“做中台”再到“+AI”的全过程。

接下来,我们将从这个行业老兵的视角,来试图理解市场真实的走向。

企业AI,为什么迟迟落不了地?

要理解袋鼠云的战略,首先要理解一个问题:为什么AI概念这么热,企业级应用满意度却没有同步提升?

拖雷给出的判断,和多数人的直觉不太一样。

拖雷认为,2026年之前,行业都在“搞模型”。“大家基本上都在做模型相关的事情,企业也在做一些通用模型能做的事,比如会议纪要、写文档、整理材料等通用技能。”

但2026年发生了一个转折,标志性事件是小龙虾的崛起与Anthropic的爆发——Q1的收入与使用量增长达到80倍,标志着从2026年起,AI从模型走入到行业场景,变成了企业AI场景落地的元年。

“Anthropic的应用场景发展很快,Open AI跟不上了。”拖雷说。这句话听起来有些激进,但他的逻辑很清楚:模型的能力已经很强了,谁能结合模型、私域数据、深入行业场景,创造最终价值,谁才是赢家。

这个判断,直接决定了袋鼠云的战略方向——基于数据、模型、智能体企业AI场景三要素,打造“Data+AI”的智能闭环。

最大的卡点:私域数据与模型脱节

那么,企业AI落地具体卡在哪里?

拖雷的答案很直接:私域数据与模型脱节,导致数据价值无法发挥。

大模型训练的是公开数据,而企业的核心数据——业务数据、行业知识、决策逻辑——都在私域。模型不理解企业,企业的数据也没准备好给模型。

OpenText报告也指出,超过90%的全球数据位于企业和政府私域。

“数据一套、模型一套,这是最大的问题。”拖雷说。

更棘手的是,私域数据中大量是非结构化的。Gartner指出,企业新生成的数据中有80%-90%是非结构化的,涵盖文本文档、PDF、邮件、音视频等,且其增长速度是结构化数据的三倍。这些数据里有经营、生产、供应链等业务事实,也有指标口径、权限边界等业务语义,还有邮件、会议纪要、合同等历史沉淀。

传统数据平台处理不了这些,AI自然也用不上。

拖雷举了一个例子:有些企业部署了DeepSeek或其他大模型,但模型根本不理解他们的数据——因为数据没有准备好给模型用。这就形成了一个悖论:模型越来越强,但企业用不起来。

从Demo到规模化:最容易被低估的挑战

如果私域数据问题是“能不能做”的基础门槛,那么从Demo到规模化,考验的就是“能不能做好”的执行力。

拖雷把企业AI应用分成两类。一类是通用性应用——会议纪要、文档生成、材料整理。这些已经在用了,门槛低、见效快。另一类是结合企业数据的深度应用——经营决策、降本提效等场景,这些还在初期。

“关键在于第一个场景能不能走通。”拖雷说。

他讲了一个亲身经历:当年在阿里,第一个数据应用场景走通之后,给了整个公司巨大的信心,逐渐发展为一家数字化驱动的公司。“星星之火可以燎原,第一步走出来就很关键。”

这个观点很重要——企业AI落地不是技术问题,是“数据+AI场景+组织”的系统工程。找到一个好的切入点,比什么都重要。

数据闭环:还没转起来,但一定会转

到这里,问题已经清晰了:私域数据是卡点,场景切入是关键,但还差最后一环——数据闭环。

理想模式是“智能飞轮”——数据驱动智能,智能反哺数据,形成正向循环。AI应用在使用过程中产生反馈和新数据,这些数据再回到系统里,让模型更懂业务、更准、更聪明。

但拖雷很坦诚:行业目前还在“把应用用起来”的第一阶段,真正的数据闭环还在建立过程中。

“大家都理解这个模式,但还在尝试场景和应用的阶段。”拖雷说。

他用广告系统做了个类比。淘宝、Google的广告系统,本质上是自动进化的——用户行为数据反馈给算法,算法持续迭代。AI应用其实也一样:先用起来,产生新的数据,再反哺,再进化。

“闭环一定会来,现阶段先用起来产生价值更重要。”拖雷说。

这个判断很关键,它意味着整个行业的AI场景落地还处在早期阶段,这也是袋鼠云巨大的机会所在。

袋鼠云要怎么破局?

讲完行业痛点,话题自然转向袋鼠云——这家公司打算怎么解这些问题?

拖雷的回答围绕着“Data+AI智能飞轮”战略展开——让数据驱动智能,让智能反哺数据,形成持续进化的正向循环。这个战略不是凭空提出的,而是对前面所有痛点的系统性回应。

袋鼠云“Data+AI智能飞轮”战略示意图

总战略:“Data+AI智能飞轮”

这个飞轮的逻辑是:企业每天产生大量数据——经营数据、生产数据、设备数据、客户数据,也包括文档、图片、视频、空间、流程、经验这些多模态数据。这些数据先要被持续接入、持续治理、持续组织,形成可以被智能理解和调用的数据底座。然后,通过各种智能体,比如智能指标、辅助决策、各种数据智能场景、空间智能场景等这些应用才能真正进入业务。

更重要的是,当这些应用跑起来以后,会不断产生新的反馈——用户怎么问、系统怎么答、人工怎么修正、结果怎么样——这些都会成为新的高价值数据,再回到平台里,沉淀成新的指标口径、知识规则、业务语义、场景模板。

支撑这个飞轮的,是“一体两翼”的能力体系。

“一体是多模态数据智能平台,负责把企业的结构化数据、非结构化数据、时空数据统一接进来,完成治理、开发、语义组织和服务供给。两翼是数据智能和空间智能。数据智能解决企业怎么更好地利用数据辅助决策,降本增效;空间智能解决企业怎么更好地感知现场、理解空间、连接物理世界。”拖雷说。

“一体是底座,两翼是价值出口,也就是袋鼠云正在做的AI场景。”

这个框架把袋鼠云的产品矩阵说清楚了:底座是数据能力,两翼是场景价值。

袋鼠云技术产品体系

产品升级:数栈V7.0多模态数据中台

底座具体是什么?是数栈V7.0,定位为“多模态数据智能中台”,最大的变化是从“只处理结构化数据”扩展到“结构化+非结构化统一管理”。该平台能实现多模态计算存储底座对接,4步20分钟完成集群配置,支持CPU+GPU混合调度,适配Hadoop、Doris、MinIO等主流存储引擎。

拖雷说,“以前客户只能解决结构化的问题,现在想解决合同、邮件、文档、音视频的问题,发现结构化数据平台已经不满足了。我们就是把这个能力补上来。”

技术上,袋鼠云有一个很务实的策略:关注增量价值,不重复造轮子。

拖雷解释说:“多模态处理涉及很多单点技术——OCR、向量库、知识图谱、视频解析等等。这些技术在各个单点上已经存在了。我们的核心不是去攻克这些技术单点,而是构建统一的管理框架——统一采集、统一存储、统一加工、统一计算、统一元数据、统一语义检索。”

他把这个平台比作一个“更大的仓库”:“你可以调用各种工具,但所有数据都在一个体系里管理。AI应用只要通过这个平台去调度数据就行了,不需要到处去找。”

两翼之一:数据智能——智能指标,要“取代报表”

底座之上,是场景应用。比如目前拖雷最看重的场景之一,是智能指标——袋鼠云的对应产品是AIMetrics 智能指标平台。

为什么这个场景重要?因为传统报表太落后了。

传统报表是被动的、滞后的,老板看报表时,问题已经发生了。而且报表不能归因分析,不能主动预警,更不能给出建议。

“智能指标可以取代报表,取代分析师。”拖雷说。

AI驱动的智能指标平台能做到什么?主动归因——“为什么上个月销售额下降了15%”;预警预测——“下个月情况会如何?”;给出建议——“建议加大华东区某渠道的投放”。

这个愿景一旦实现,企业决策方式将被重构。

当然,拖雷也承认“路很长”——要结合行业know-how、企业决策习惯、私有数据。但方向是明确的。

两翼之二:空间智能——从“看见”空间到“预演”未来

如果说数据智能解决的是“理解经营”的问题,那么空间智能解决的就是“感知现场”的问题。

拖雷说,空间智能主要让企业更好地感知现场、理解空间、连接物理世界,典型能力包括数字孪生、仿真推演、AI数字人、空间智能体。

底座和场景之间,还有一个关键角色——交互入口。

袋鼠云的“灵瞳智能体”承担了这个功能,它不是孤立的聊天机器人,而是连接用户与整个产品体系的桥梁。用户通过自然语言对话,灵瞳将需求分发到数据智能、空间智能等各个产品线去执行。

拖雷把它比作“一个聪明的小助手”:“你可以跟它对话,它把你的需求分配给各个产品去执行。”

目前,灵瞳智能体已覆盖数据开发、数据治理、数据分析和产品操作四个场景。据介绍,它能帮助用户显著提升业务效率。

战略和产品之外,商业化是另一个关键问题。

不同行业,袋鼠云的打法不一样。

“金融行业我提供标准化产品就行。在水利行业,客户关注的是大坝安全、防洪防灾等场景,大部分行业都跟水利行业一样,更多关注的是业务场景,做价值驱动。”拖雷说。

淹没范围仿真推演

定制化方面,袋鼠云的原则很清晰。

“我一定希望做可复用的东西。如果你定制化特别多,我们也会拒掉一些。”拖雷说。这个原则在ToB领域很难坚持,但袋鼠云选择了一条更可持续的路——不做“单个项目公司”,做“通用场景公司”。

出海方面,袋鼠云去年开始布局。目前规划了三步走的策略:服务中国出海企业(东南亚、中东)→服务海外华人/跨境企业→服务本地海外企业。

“海外市场更健康——没那么内卷,定制化需求少,付款意愿强。”拖雷说。这或许是袋鼠云寻找增量的一个重要方向。

Data+AI——全球同行的共识

很多人会把袋鼠云视为“中国版的Databricks”。这个类比并非毫无道理。

拖雷自己也承认这一点:“早期技术路径很相似,都是做大数据的底座出身。”事实上,两家公司在核心逻辑上是高度一致的——都在构建从数据治理到AI应用的一体化平台,都在解决“让企业数据更好地为AI服务”这个核心命题。袋鼠云的“智能飞轮”与Databricks的“Data Intelligence Platform”,本质上是同一个方向的两种表达。

差异当然存在——Databricks偏公共云标准化,袋鼠云偏私有化部署和行业场景。但这更多是中美市场环境的不同,而非技术路线的分野。正如拖雷所说:“在Data+AI这个大方向上,大家的判断是趋同的。”

当然,袋鼠云不是简单的“中国版”,而是这条全球共识赛道上的一个中国样本。

接下来,往哪里走?

对话的最后,话题转向未来。拖雷分享了袋鼠云接下来的重点方向,以及对行业趋势的判断。

拖雷说,袋鼠云接下来会重兵投入三个方向。

第一,多模态数据智能平台持续迭代,包括高质量数据集、语义理解、AI智能体的高效搭建等——让AI能够快速生成、准确地“读懂”企业各类数据。这不仅仅是技术问题,这是未来智能体的底座。

第二,数据智能深化。继续深耕“智能指标”场景与其它业务场景,比如智能指标,结合行业know-how和企业决策习惯,真正取代传统报表与分析师。拖雷认为这是“非常好的未来场景”,但“路也很长”,类似医生助手,目前起码可以做到很好的辅助决策效果。

第三,空间智能突破。深化仿真推演能力——从“看见”空间,到“预演”未来。比如在亚运会项目中,袋鼠就支持了赛前模拟推演,赛中安防安保,赛后丝滑散场的实战指挥场景。目前,类似这样的空间智能场景已经扩展到工业,港口,能源矿山等不同的行业中。

我问了拖雷最后一个问题:袋鼠云最想做的事情是什么?他的回答很干脆:以智能飞轮推动AI在企业的价值释放。

这个答案不算意外。从“数据中台”到“智能基础设施”,袋鼠云十年的演进轨迹,恰恰映射了中国企业数据服务产业的变迁——从“把数据管好”到“让数据产生智能”,从支撑决策到驱动业务。

而这个变迁背后的驱动力,是Data+AI正在释放的巨大价值。

试想一下:当企业所有的数据——经营数据、生产数据、客户数据、设备数据,连同那些沉睡在合同、邮件、图纸、会议纪要里的非结构化数据——被真正组织起来、被AI理解、被智能应用调用,会发生什么?

决策不再是经验主义的。CEO不再需要等分析师花三天拉一份滞后的报表,AI可以在几秒内告诉他“为什么下降、会跌多少、该怎么办”。生产不再是“出了问题再修”。设备运行的微小异常可以被提前捕捉,在酿成故障之前就完成预测性维护。营销不再是广撒网,AI可以基于全域数据理解每一个客户,在正确的时机、用正确的方式触达。

这正是袋鼠云这样的数据智能厂商的机会,也是它选择的方向。

“让数据与智能持续共生。”拖雷在发布会上用这句话总结了袋鼠云的十年,也定义了下一个十年的方向。

闭环还在蓄力,飞轮还在加速。但当数据和智能真正开始相互滋养,企业数智化的下一个时代,才刚刚开始。

历史的车轮将走向哪里,未来又会发生哪些精彩的故事,就让我们拭目以待吧。

 
最新文章
相关阅读