张翅：百炼成金，金融大模型探索与实践

admin 2024-09-27 14:35:02 48

默认

摘要： ...

　　2024年服贸会专题活动之一——“第六届中国金融科技论坛”于9月12日-13日在北京举行。阿里云智能集团副总裁、新金融行业总经理张翅出席并演讲。

　　张翅表示，金融行业拥抱大模型是一个不可避免的趋势。得益于先前的数字化积累，金融机构在接纳大模型时比以往更有优势。回顾过去，阿里云已经与多家金融机构在云原生架构方面展开了合作。现在看来，AI时代的命题就像我们当年面对云计算转型一样。我们愿意在这个过程中长期与金融机构合作，明确问题所在，并直接面对，将技术能力和先进性与实际需求相匹配。

　　以下为演讲实录：

　　尊敬的尚福林主席、邢炜会长，以及各位来自各大银行的领导、专家们，非常荣幸能够来到第六届中国金融科技论坛，并有机会在这里分享我的观点。曾经，我们对于“金融科技”这个词有所保留，但随着国家数字金融“五篇大文章”的提出，特别是在大模型技术快速崛起的背景下，金融科技再次成为了行业的焦点。

　　云计算与金融行业的深度融合，见证了从最初的“云+Fintech”理念到如今银行核心系统向云原生架构转型的过程。这不仅是技术层面的变化，更是数字金融迈向智能化新时代的重要标志。今天我们看到数字金融智能化的要求和发展会到一个新的阶段，所以我今天分享的主题借用了我们阿里云一款产品的名字“百炼成金”。百炼是阿里云的一款模型工具，通义点金是通用大模型金融板块的一个部分，这个名称寓意着中国金融行业从借鉴国外经验到自主研发，再到今天大模型技术的应用，经历了一段百炼成金的过程。

　　阿里云的成立与发展紧密关联着信息技术的进步，金融行业也是如此。从古老的算盘计算，到信息化时代的曙光，再到数字化转型的浪潮，直至今日智能化时代的到来，这是一个循序渐进、不断演化的历程。每一次技术革新及其与业务系统的融合，都遵循着特定的周期规律，正如Gartner技术成熟度曲线所展示的那样，技术的发展通常伴随着起伏波动。

　　然而，随着大模型技术的兴起，我们迎来了金融行业的新篇章与全新挑战。在短短的一两年间，从GPU芯片的普及到算力基础设施的构建，再到大模型训练的广泛应用，技术革新迅速。尽管去年曾上演过“百模大战”甚至“千模大战”的热闹景象，但现在能够独立完成大模型训练的企业却屈指可数，这主要是因为在硬件、软件乃至工程化方面存在着诸多难以逾越的障碍。

　　尽管大模型正处于蓬勃发展的阶段，但其在业务应用领域的突破性产品仍相对稀缺。相比之下，在互联网时代，诸如社交软件、游戏、支付工具等应用曾引领潮流，它们以其独特的功能吸引了大量用户。然而，大模型至今尚未催生出类似的现象级应用。即便如此，我们依然坚信，大模型技术将成为推动未来经济发展的全源。

　　对于金融行业而言，此刻我们需重新审视数字化进程。当数字化转型步入中期阶段时，我们应当思考下一步的方向。过往的经历包括系统迁移至云端、数据集中存储、以及云原生架构改造等。然而，我们是否真正创造了预期的业务价值？在评价数字化进展时，我们通常谈论的是数字化的渗透率和深度。以数据为例，虽然银行已完成了数据治理，但数据所发挥的作用并未达到我们的期望值。展望未来，我们有理由相信，大模型或许是解锁数据真正价值的关键所在。大模型的未来发展在很大程度上取决于系统的灵活性和数据的质量，这两者之间相辅相成。

　　此前有观点认为，所有的应用程序都值得用大模型重写一次。例如，在自动驾驶、终端设备以及设计师辅助软件等领域，采用端侧模型或车载模型后，智能化水平得到了显著提升。此外，阿里云通过大模型重构了自身的组织文化，利用大模型助手实现了销售、技术、人力资源及财务等业务线的一体化管理。借助大模型的智能问答功能，我们发掘了以往未能充分利用的数据价值，进而洞察组织和个人在经营活动中的效率与质量。这让那些不擅长信息技术的HR主管和业务主管也能通过自然语言表达他们所需的数据信息，而不再局限于传统的报表形式。

　　阿里云早在多年前就开始布局大模型的研究与开发。正是由于在前期投入了大量的时间和精力，我们才能够在最近一年多的时间里，在众多追赶GPT技术潮流的竞争者中脱颖而出。我们不仅将通义模型开源，还积极与众多金融机构合作，取得了显著成果。未来，我们将持续不断地推出新的模型能力和应用，以期进一步推动行业发展。

　　我们并不盲目追求大模型的规模，而是更注重模型的实际应用价值。因此，我们不仅推出了大型模型，还推出了小型模型版本，以适应不同场景下的具体需求。我们认为，未来的模型架构应该是大模型与小模型相结合，整个模型系列将会朝着更加多元化和灵活的方向发展。阿里云将持续投入资源，不断进化，致力于让更多的企业能够平等地使用大模型，并将其与自身业务场景紧密结合。

　　在模型定位方面，我们将其分为两大类：一类是技术模型。技术模型又细分为两种：一是传统意义上的基础大语言模型；二是多模态模型。在金融行业中，多模态模型尤为重要，例如在处理客服语音、理赔、保险、理财及信贷等业务时，需要强大的多模态语言理解能力来生成和交互内容。多模态语言模型无疑将是未来发展的重点之一，也是中美两国在该领域竞争的关键点。

　　曾经，我们设想为每一个行业定制一个大模型，但实际上这是不切实际的。行业大模型在准确性和严谨性上有极高的要求，而其自身的迭代过程也充满了矛盾。因此，我们现在更倾向于开发基于行业数据语料和特定主题训练的小模型，并通过Agent框架进行集成。这样，可以将金融领域的专业知识整合到Agent中，同时将专业文档数据和素材纳入小模型，通过Agent的方式实现结合，从而推动整个通义大模型家族的全面升级与开放。

　　模型的能力在不断发展和变化，通义千问2.5在中文环境下，不仅在文本理解、文本生成、知识问答与生活建议、闲聊与对话等方面超越了GPT-4，而且在安全风险防控上也表现出色。对于大模型而言，我们尤为重视四个核心能力：理解能力、逻辑推理、指令遵循以及代码能力。

　　正如前面提到的，目前中国许多企业面临着算力不足的问题，难以进行大规模的预训练。为了降低企业和开发者选择及应用大模型的门槛，阿里云将持续推进开源策略。我们希望通过在大模型方向上的长期战略投入，推动中国大模型领域的全面发展和技术进步。

　　模型推理是AI规模化应用的关键支撑。算力的成本效益直接影响应用的规模，而对于延时敏感的应用，则需要依赖于就近的推理服务。此外，面对用量波动的情况，还需要具备弹性伸缩和高可用的服务。因此，云计算凭借其卓越的算力调度能力和大规模分布式特性，成为了打造高效模型训练与推理的理想平台。

　　阿里云“百炼”是一个超低延时的模型推理与服务平台。在服务了多种类型的客户后，该产品获得了长足的发展。过去是统一的API，现在底层是异构算力底座，通过自动扩缩容等诸多方法，帮助客户在业务的波峰波谷中更高效的管理集群资源，达到降本增效，自动模型压缩，实现更少资源，更低时延，推理加速，实现动态打包，流水执行。如今，“百炼”推理框架已经在多个行业得到了广泛的应用。当然，我们也意识到金融行业有着独特的私有化架构需求，因此我们致力于确保技术应用符合金融行业的合规标准。

　　如今，阿里云已成为众多大模型企业的AI基础设施。我们希望与更多大模型应用平台及公司合作，不仅限于原有的业务系统和数据处理能力，更希望在未来与传统APP、汽车行业、制造业、物流业等各行各业建立联系，共同探索AI技术的新方向。

　　在金融行业，我们已经进行了大量的实践。金融行业的数字化挑战是全方位的。正如尚福林主席所提到的，如何提升服务的广度和深度，提高服务质量，金融大模型同样扮演着重要角色。无论是服务于普通消费者还是小微企业，通过大模型可以提供更为精准和个性化的服务体验。例如，小微企业提交财务或信贷报告时，大模型能够更准确地理解其需求。对于中国企业出海，跨境贸易涉及的海关、报关和财务管理等内容，都可以通过大模型来改善服务体验。此外，金融大模型正在重塑交易链路，从客户服务到核保、核赔等环节，都将通过自动化处理来提升效率。我们提出的“数智化劳动力”概念，是指通过技术替代低效、重复性的工作，而非简单地裁减人力，从而大幅提升工作效率。

　　同时，我们也看到了基于大模型的新产品的不断涌现。许多银行已经开始尝试用大模型重构其移动应用。例如，在外滩峰会上发布的“支小宝”，就是一个典型例子。这款应用将生活助理和财富助理等功能从支付宝的传统界面中剥离出来，转变为全新的大模型交互式手机银行APP。在这个应用中，无论是查询个人资产还是进行交易操作，用户都可以通过自然语言交互获得个性化服务，不再受限于传统的点击导航模式。

　　金融大模型还将重构金融团队的运作方式。利用大模型的学习和泛化能力，可以模拟顶级金融专家的思维方式，从而减少对资深专家的依赖。通过这种方式，企业的经营文化和管理模式也可以得以沉淀和传承。

　　最终，这些变革将减少公司的事务性工作负担，提升创造力和效率，这正是AI技术在重塑数字化价值方面所展现出的强大潜力。

　　大模型在金融行业的应用场景主要包括营销、风控、客服、运营、办公以及代码开发等，这些领域往往对人工操作的效率和质量有着较高的要求。我们真正的目标是：重新思考企业级、金融级的AI原生能力体系。过去更多的是实验性质，有许多AI大模型专家在进行创新试点，探讨大模型的训练和应用方法。而现在，我们认识到应该按照真正原生的企业级能力体系来进行构建，无论是从模型的研发、推理与运行，还是模型应用的开发、测试及最终部署，都需要从这个角度出发，明确所需的AI能力，并重新设计体系架构。其中，模型安全是一个至关重要的因素。这不仅涉及到大模型本身的防护，还包括使用大模型后整体管理体系的安全。由于大模型可能会面临被渗透、数据泄露等问题，因此需要进行全面的安全考量。鉴于此，阿里云在推广金融行业的大模型应用时，并非仅仅着眼于基础设施的建设、算力的提供或模型的基本发展，而是更多地关注如何构建一个完整的金融级AI原生体系。虽然我们目前仍处于起步阶段，但从一开始我们就应该审慎规划，明确可能面临的挑战与问题，然后逐步扩展应用规模。

　　阿里云通义点金作为一站式金融AI应用平台，跟那些APP上简单的问答不同，它把金融的专业性和应用性嵌套进去，具有金融专属、金融强化、开放生态的特点。

　　阿里云的通义点金作为一个一站式的金融AI应用平台，与那些简单的APP问答功能不同，它融入了金融的专业性和实用性，具有金融专属、金融强化以及开放生态的特点。

　　成本、效果与安全构成了大模型应用的“不可能三角”。一方面，我们需要节约成本，避免一次性巨额投资于算力、人才和模型；另一方面，我们也需要确保投资能够带来实际效果，证明其业务价值。安全则是另一个重要方面，模型的应用和运行的安全性问题，都是必须综合考虑的因素。在我看来，云智融合是破解大模型应用的不可能三角的重要路径。

　　今天，金融行业拥抱大模型是一个不可避免的趋势。得益于先前的数字化积累，金融机构在接纳大模型时比以往更有优势。回顾过去，阿里云已经与多家金融机构在云原生架构方面展开了合作。现在看来，AI时代的命题就像我们当年面对云计算转型一样。我们愿意在这个过程中长期与金融机构合作，明确问题所在，并直接面对，将技术能力和先进性与实际需求相匹配。

　　我的分享就到这里，谢谢大家。

　　新浪声明：所有会议实录均为现场速记整理，未经演讲者审阅，新浪网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

海报

阅读