金融机构想要什么样的大模型？-数据猿的专栏

金融机构想要什么样的大模型？

2024-04-23 18:55:28栏目：默认栏目 IP属地：IP未知

人们对于大模型的态度，仿佛像把齐天大圣扔进太上老君的八卦炉，立志在短期内掌握七十二变的变化之道。

尤其是垂直大模型，已成为各行各业竞相追风的一大热点，这种“大模型+”的模式已经成为企业探索创新和转型的重要趋势。近日，在“2024人工智能大模型产业发展大会”上，AI专家、业界领袖及政策制定者共同探讨了大模型的应用领域。其中，猎豹移动董事长兼CEO 、猎户星空董事长傅盛就大模型参数规模表达了自己的观点，“千亿昂贵全面，百亿省钱专业。在企业场景中，专业足矣，更具性价比。百亿参数推理成本只有千亿参数的1/10。”

这就产生了一个问题，在金融科技领域，垂直大模型究竟需要对哪些方面具体关注？目前金融大模型处于什么状态？金融机构会如何选择部署大模型？

多数金融大模型应用于非核心领域

在金融科技的浪潮中，金融大模型正逐渐成为改变游戏规则的关键力量。这些模型，凭借其处理海量数据的能力和对市场动态的深刻理解，正在金融业的多个领域引发革命。

目前，国内外的金融机构和科技公司都在积极布局金融大模型。2023年5月中旬，奇富科技首先宣布推出金融行业通用大模型奇富GPT，号称“国内首个金融行业通用大模型”。2023年5月，度小满推出国内首个千亿级中文金融大模型“轩辕”。恒生电子于2023年6月发布了金融大模型LightGPT，并对其进行升级，形成“LightGPT+WarrenQ+光子”体系。2023年9月7日和9月8日，腾讯混元大模型和蚂蚁金融大模型相继正式亮相。2023年11月，幻方量化旗下DeepSeek推出DeepSeek LLM 67Bt，相较于其他金融模型拥有更突出的推理、数学、编程等能力。

2024年开年之初，同花顺和东方财富分别推出问财HithinkGPT和妙想金融大模型。工商银行也已经建立了千亿级的AI大模型技术体系，招商银行也在大模型生态建设上取得了进展。马上消费天镜大模型在智能对话、智能超级员工、智能辅助、智能合规四大核心领域已经成功落地相应的场景产品。

以下为数据猿整理的目前在金融大模型领域布局的企业及应用领域，列表并非囊括市场上所有涉及金融大模型的企业，包括直接研发并推出金融大模型产品的金融科技公司、积极参与相关标准制定的科技巨头、以及通过研报等方式对金融大模型进行分析的金融机构。此外，部分企业虽然未直接公开具体的金融大模型产品名称，但根据已有资料，它们在金融大模型技术研发与应用方面有所布局。

从上述图表中，数据猿观察到，目前在已“成型”的金融大模型大部分将领域聚焦于办公、开发、营销、客服等业务场景。

其实，金融大模型的应用非常广泛，涉及风险管理、客户服务、投资决策、反欺诈等多个领域。这些应用不仅涵盖了金融机构的基础业务流程，如智能风控、智能投顾、智能投研等，还包括了客户服务、理赔自动化、智能客服等交互领域。此外，金融大模型还在贷款评估、风险控制等方面发挥着重要作用。

在客户服务领域，金融大模型通过自然语言处理技术，提供个性化的客户咨询和支持，极大提升了客户体验。在风险管理方面，大模型利用其强大的数据处理能力，快速识别潜在风险点，提高了风险管理的效率和准确性。而在投资管理领域，金融大模型通过分析市场数据和趋势，为投资决策提供支持，尽管目前仍在探索阶段，但其潜力不容小觑。

尽管大模型在处理大量数据、发现潜在模式和预测市场趋势方面展现出了巨大的潜力，但金融机构仍然倾向于将其应用于非核心业务领域。

大模型在应用于金融的核心业务场景中还面临哪些挑战？数据猿发现，在投研领域，大模型虽然能够提供深度的市场分析和投资建议，但受限于模型的解释性和准确性，目前还未能在核心投研决策中完全替代人类专家。在交易执行方面，大模型可以实现自动化交易策略，但由于市场波动和监管限制，其应用仍需谨慎。而在风控领域，大模型虽然展现出强大的潜力，但在处理复杂金融衍生品和市场异常情况时仍存在局限性。

金融大模型在金融领域具有广泛的应用前景，能够为金融机构带来显著的价值。然而，要充分发挥金融大模型的价值，还需要解决数据不足、模型过拟合和可解释性等挑战。

金融大模型何时才能真正达到其价值？

说到大语言模型，数据、算力、算法这三个关键数据永远逃不开众人的关注。数据猿注意到，通用大语言模型不是在“卷”参数，就是走在“卷”参数的路上。即使是拥有先机优势的OpenAI也多次被爆出意图使用外部数据训练自家产品，作为后来者的谷歌、Meta为了能够得到更多的数据来训练自己的大语言模型，也是各显神通，试图笼络一切可以拥有的资源。

无可厚非，单就通用大语言模型来说，参数规模越大，数据量越多，肯定更有利于产品的进步。尤其是高质量的数据，企业所拥有的高质量数据越多，大语言模型在表达能力、泛化能力、任务性能、多任务学习和迁移学习等方面就越有优势。

既然如此，将大语言模型融入金融领域，是否也需要更多的参数？数据猿整理了目前市面上已披露参数规模的金融大模型产品，发现呈现两级分化的现象。

其中，度小满和同花顺的金融大模型将产品从参数方面分为了多个类别。3月11日，度小满宣布“轩辕”系列新增开源6B、13B、70B三种参数12款金融大模型，对此，度小满表示，在“轩辕”模型矩阵中，70B及以上模型适合针对需要深度分析、复杂指令执行以及全方位Agent调用的场景，而6B、13B的模型则更加适用于对响应速度有高要求、面向小规模场景和单任务的应用。”轩辕”6B-4-bit量化Chat模型则以其低推理部署成本，进一步降低大模型的应用门槛。

1月，同花顺和东方财富相继推出了旗下AI 大模型产品。同花顺HithinkGPT 提供7B、13B、30B、70B 和130B 五种版本选择，东财妙想大模型提供7B、13B、34B、66B 及104B 五种版本选择。

数据来源：公开信息，数据猿整理

不过，仍有企业将大模型参数定位到了千亿级别。例如，工行2023年报显示，其建成同业首个全栈自主可控的千亿级AI大模型技术体系，实现在多个金融业务领域创新应用。3月23日，上海报业集团旗下的财联社与阶跃星辰共同打造的千亿级金融大模型发布——财跃F1金融大模型，致力于构建在智能运营、智能风控、智能投顾、智能营销、智能客服等方面的多个“AI+”大模型应用场景。

针对此现象，数据猿与吾道科技进行了沟通，吾道科技目前也在金融大模型领域做相关的探索，其表示：“其他条件不变的情况下，一般来说都是参数规模越大能力越强，但是在根据所在领域肯定会选择不同的参数规模做实际的落地，主要还是受限于机器性能和成本，比如多数需要企业内部部署的场景都会选择14B甚至更小的模型，而在公众领域，用户都是通过互联网接入大模型，大模型运行在云端数据中心，这时候肯定是选择规模更大能力更强的版本。”

拓尔思金融和产业大脑产品中心总经理周宁捷提到，所谓的金融大模型实际上是一个伪命题，因为它的概念过于宽泛，它在实际应用中需要细化到具体领域，而不是试图覆盖所有领域。在设计基座大模型时，通常参数规模越大，模型性能越强，因此可以认为参数越大越好。然而，对于垂直大模型，其参数规模应根据具体需求来决定，不能一概而论。同时，为了实现更好的价值，大模型应与其他技术相结合使用才能更好的赋能金融机构。

数据猿认为，金融大模型的参数规模确实在一定程度上影响了模型的性能，但这并不意味着参数越多越好。参数规模的增加会带来一系列的变化和挑战，需要根据实际情况进行权衡。对于金融行业而言，除了模型性能外，还需要重视模型的安全性、稳定性、可解释性和合规性。因此，并不是所有情况下都应该追求最大的参数规模，而是应该寻找最适合解决特定问题的模型规模，平衡性能和成本，同时确保模型的可靠性和透明度。

就此来看，金融大模型，不只是“大”那么简单。

金融大模型，它不仅仅是“大”在数据处理能力上，更在于它对金融业务的深度理解和应用。从客户服务到风险管理，从投资管理到营销优化，金融大模型无一不精，无一不通。

同时，吾道科技提到，金融行业积累了大量不同格式的数据，如PDF、Word、HTML等，如何高效地进行数据清洗和保存，是一个复杂而艰巨的任务。同时，在严格遵守监管法规的前提下，确保数据的合规性也是我们必须考虑的问题。

大模型这两年非常火，并且确实给大家带来了很多惊喜，但在实际应用方面还处于探索阶段，大多数探索性的应用都是基于通用大模型。而想要金融大模型实现所谓的“价值”，其中，最不应该忽视的一点就是，这一通用大模型基座本身能力如何。

某金融机构投资总监邹杰在探讨金融大模型的发展前景时，提出了一个深刻的见解。他认为，金融大模型的真正潜力在于其能够推动创新和创造性的解决方案，尤其是在金融服务领域中那些尚未被充分探索的创造性领域。然而，当前的技术发展阶段尚未达到能够充分发挥这种潜力的水平，特别是在大模型的基础设施能力方面，还存在一定的局限性。为了使金融大模型能够在未来真正释放其价值，其强调了做好基础工作的重要性。这意味着我们需要在技术开发和研究上投入更多的精力和资源，以确保大模型的基座能力得到加强和完善。这包括但不限于提升数据处理能力、优化算法效率、增强模型的泛化能力和可解释性，以及确保模型的安全性和合规性。

金融机构：自研大模型还是拿来主义？

金融大模型的优势不可置否，但金融科技的浪潮一波接一波，金融机构站在了一个新的十字路口：是投入巨大资源自研大模型，还是搭便车接入现成的大模型？这不仅是个技术问题，更是一场关于未来战略的豪赌。

作为金融大模型的甲方“爸爸”，金融机构是最有话语权的一方。选择自研还是接入，数据猿认为，资金实力是首要影响因素。

以银行为例，科技是银行发展的关键驱动力，国有六大行则是银行科技投入的核心发动机。厚学研究数据显示，国有六大行的金融科技投入总金额创出1228.22亿元的新高，同比增长5.38%。虽然近几年金融科技投入增速呈现逐年放缓趋势，但科技投入占营业收入的比例在2023年却达到了3.52%的新高。就此来看，国有银行是最有可能选择自研金融大模型的企业。

以下为六大行在大模型方面的布局：

其中，工商银行在自主研发方面取得了显著成果，建成了同业首个全栈自主可控的千亿级AI大模型技术体系，并在多个金融业务领域实现了创新应用。例如，在网点运营上，推出了基于大模型的网点员工智能助手，提升了网点效能；在消费者权益保护方面，将生成式AI、自然语言处理等技术应用于投诉处置和管理主要环节，提高了监测分析的智能化水平。

农业银行AI研发团队推出了类ChatGPT的AI大模型应用ChatABC，并在科技问答场景进行了内部试点。ChatABC大模型的建设重点着眼于大模型在金融领域的知识理解能力、内容生成能力以及安全问答能力，实现了全方位的金融知识理解和智能问答应用。

而邮储银行等通过接入百度的生成式AI对话产品“文心一言”，实现了其在AI大模型应用上的首次尝试。银行可以集成“文心一言”的技术能力，在智能风控、智能运营、智能投研、智能营销等金融场景开展大语言模型技术应用。

与此同时，数据猿发现除六大行外，其他已上市的银行也披露了在大模型领域的动态，但大部分银行目前选择的是接入模式，如江苏银行、百信银行、民生银行、兴业银行、苏州银行等，包括未上市银行新网银行、众邦银行、恒丰银行等也同样选择了接入模式。

某金融机构投资总监邹杰针对选择接入大模型还是自研这个问题表达了看法，其表示接入大模型更合理，通过选择市面上各方面能力较好的通用大模型接入，并在应用方面做深入构建，可以减少底层研发的成本，能够实现更好的效果。

吾道科技则认为，从短期来看是接入大模型能够更快的验证应用场景，甚至产生实际应用效果。从长期看自研大模型可能更能贴合企业的应用场景，但是这里也存在很多不确定性和风险，如：1）本企业是否具备自研大模型的能力 2）自研大模型能否达到预期效果 3）自研大模型的投入周期与成本是否适合本企业。

选择接入通用大模型还是垂直大模型需要根据应用场景的特性具体分析，看通用大模型能否满足应用需求，垂直大模型是否更优。

其次，是关于数据安全性。如果金融机构选择了接入大模型，那么与科技公司之间的数据共享问题就浮出水面了。数据共享就像是一场合作与博弈的双簧戏，既要保证数据的安全和隐私，又要确保合规性。这就需要金融机构和科技公司之间建立起一套完善的数据共享机制。

难题一：数据隐私保护

金融机构和科技公司要共同面对的首个难题就是如何保护数据隐私。毕竟，客户信息一旦泄露，后果将不堪设想。

难题二：数据产权归属

数据共享中，数据的所有权和使用权的界定也是个大问题。金融机构和科技公司需要明确各自的权益，避免未来的纠纷。

难题三：合规性要求

在监管越来越严格的今天，金融机构必须确保数据共享的合规性，否则可能会面临法律风险。

面对这些难题，金融机构和科技公司可以采取哪些合作共赢的策略？智谱AI针对不同的用户需求，总结出三种主要的商业模式：API、云端私有化、本地私有化。

第一种是最轻量级的，把模型封装成开放平台，以提供API的方式，给开发者企业调用，按照调用量进行付费，商业模式非常简单成熟。

第二种，考虑到有些企业非常关注自己使用过程中的用户数据，需要有相对比较独立的数据保障，但同时又不希望自己去维护算力等基础设施，智谱AI提出了基于云端算力的"云端私有化"方案，利用智谱AI的云端算力，帮助用户开辟专门的模型专区。在此类服务过程中，会保持数据与其他客户的相对隔离。

第三种，完全私有化的落地方式。

在金融科技的浪潮中，金融大模型的发展和应用无疑是一个值得深入探讨的话题。正如我们在文章中所探讨的，金融大模型的未来充满了无限可能，但同时也面临着诸多挑战和不确定性。在这个关键时刻，金融机构必须做出明智的选择，以确保在未来的竞争中保持领先地位。

首先，金融机构需要认识到，无论是选择自研还是接入现有的大模型，关键在于如何将这些技术与自身的业务深度融合，创造出真正的价值。其次，金融机构在推进金融大模型的应用过程中，应当重视数据的安全性、合规性和隐私保护。再者，金融机构应当关注金融大模型的长期发展，而不仅仅是短期的效益。最后，金融机构还应当积极参与到金融大模型相关的标准制定和行业对话中。

总之，金融大模型的发展是一个复杂而多维的过程，涉及到技术、业务、法律和伦理等多个方面。金融机构必须从多角度出发，综合考虑各种因素，才能在这个充满机遇和挑战的领域中取得成功。随着技术的不断进步和市场的不断成熟，我们有理由相信，金融大模型将成为推动金融行业创新和转型的重要力量。让我们拭目以待，金融大模型将如何在未来重塑我们的金融服务和经济生态。