外滩掀起了“AI热”

2023-09-10 15:42 由董寒雪发表于 #商业

撰文 | 李信马

题图 | 蚂蚁集团

热闹了3天的上海外滩大会终于落下了帷幕，但余音还在回荡。作为金融科技顶会，上一届的外滩大会时，金融科技中金融的“浓度”很高，而这一届大会，科技成为了主旋律。人工智能，尤其是大模型，成了本届大会的热词。

这也不奇怪，根据最新的统计，国内“百模大战”的参战方已经增加到了至少130家公司，其中做通用大模型的有78家。从投资的角度来看，今年上半年生成式人工智能领域的投资额，已经超过了去年全年，美国头部的前25家AI公司总融资额超过了170亿美元。

麦肯锡中国区主席、全球资深董事合伙人倪以理在外滩现场预测：“AI 对全球经济的潜在收益将达到 25 万亿美元，是当前所有企业最重要的赛道之一，但这个时代刚刚开始。”

大模型的魅力为什么这么大？蚂蚁集团（以下简称“蚂蚁”）董事长兼CEO井贤栋引用电影《奥本海默》的一句台词：“this is not a new weapon. this is a new world.”在他看来，大模型是一项新技术，但又不只是新技术，而是足以引发世界级的变革。

自然而然地，蚂蚁也发布了他们的金融大模型。据了解，这款大模型是基于蚂蚁的自研基础大模型，然后针对金融产业深度定制的。此外，蚂蚁还发布了基于金融大模型能力的两款产品：智能金融助理“支小宝2.0”，服务金融产业专家的智能业务助手“支小助”。

其中，“支小宝2.0”已内测近半年，将在完成相关备案工作后上线。“支小助”正在与蚂蚁平台合作机构内测共建，为理财顾问、保险代理、投研、金融营销、保险理赔等金融从业者打造全链条的AI业务助手。

可以说，在金融科技领域，以后大模型也是顶流了。

对到场的专家和学者们来说，他们又是怎么看待大模型的呢？以及，大模型又该如何落地行业，真正改变世界呢？

01. 大模型时代

人工智能70年的发展中，经历了多次的高峰和低谷，但“让机器掌握完成复杂任务的知识和能力”这一终极目标却基本没有改变。

当前，我们可以说已经进入了“大模型时代”，大模型的特点就是可以实现大规模无标注数据的深度学习，由于无标注数据廉价且易得，模型学习的范围和水平都迎来了极大的提升，大模型的参数量也在不断攀升，从1亿左右增长到了现在GPT的31750亿，可以说是科技领域的暴力美学。而且从ChatGPT的经验来看，更多的数据、更大的模型还可以带来更多的智能。（以下部分内容和图片来自清华大学计算机科学与技术系副教授刘知远的演讲，文中不再另做说明）

图片来源：外滩大会

可以说，大模型是迈向通用人工智能的技术。刘知远总结了大模型在两方面的优势，首先，是通用框架，能有效降低开发成本。自上世纪五十年代以来，成千上万个不同的神经网络解决方案被提出过，但在2017年Transformer被提出来后，这些神经网络架构日益混凝在Transformer架构下，2020年后大模型的发展，让大语言模型架构更加统一。

其次是大模型的通用能力，能有效降低适配成本。以前深度学习模型总是用于专用的任务，标注专门的数据，训练专用的模型，而没有办法拓展到其他任务。比如场景像客服、营销、售前，行业像房地产、金融，最后结果是每一个行业的每一个场景都要做一个小模型，总的成本就很高，但通用大模型微调后可以完成不同的任务，在每一个任务都可以有非常好的表现。

图片来源：外滩大会

也因为这两方面的突出优势，大模型有潜力成为智能时代基础设施。刘知远认为，迈向通用人工智能的路径会是语言智能、多模态智能、工具智能、具身智能、群体智能，目前人类语言的智能已经基本被实现了，接下来会是其他智能相关探索。

图片来源：外滩大会

以上是技术层面的分析，从商业的角度来看，大模型能挣到上一代AI挣不到的钱。小冰公司CEO李笛认为，以前行业靠粗放式的API调用和Traffic的模式，赚到的钱基本就是成本。比如为媒体生成稿件，撰稿人原来每篇是1500元，但API调用，一家媒体可能每月只支付几百块，最后整个市场不过大几十万。

还有最近很火的游戏公司用生成式AI做美术资源，可以为游戏公司节省几百万上千万的成本，但他们愿意为专门私有化部署的模型支付价格大概也就10万人民币左右。李笛甚至现身说法，目前在汽车智能座舱领域，小冰的市占率很高，但按调用次数付费，却连研发成本都收不回来。

而大模型的创造力，可能带来AI商业模式上的改变，比如去年年底开始，小冰公司和网飞联合打造了帮助动漫工作室端到端生成视频作品的平台。如果按照传统的商业模式，一次性技术开发的收费大概不到30万人民币，但一部《人和狗》的3分钟短片，就为小冰公司获得了15万美元的回报。

目前大模型在移动互联网领域，不断有应用落地，在企业级应用，也有新的探索，未来在传统产业呢？大模型还有近乎无限的应用可能，比如，科学家们认为，大模型已经类似于人脑，那如果我们给它外接上摄像头，它是不是就有眼睛了？如果再加上手臂甚至翅膀呢？随着深层次人工智能不断落地和普及，新的改变还将会不断发生。

02. 蚂蚁大模型

回到文章开头，蚂蚁投入到人工智能的研发差不多有10年的时间，本身就有非常丰富的AI业务场景，投入方向主要是降本增效和提升用户体验。目前，大模型应用的一个难题是喜欢“胡说八道”，因此，在应用到行业上时，尤其是金融这样追求严谨的行业，厂商会格外慎重。

“通用大模型无法在专业严谨的领域直接商用，特别是金融服务对错误的容忍度很低，金融大模型要确保领域知识和专业逻辑的严谨性，才能真正落地带来产业价值。知识力、专业力、语言力以及安全力，保障四大能力是前提条件，也是金融大模型要解的产业真命题。”蚂蚁集团副总裁、金融大模型负责人王晓航在活动中介绍道。

不过，这并不意味着就忽视基础大模型。蚂蚁集团副总裁徐鹏在演讲中介绍，蚂蚁的大模型体系里，最核心的依旧是基础大模型，而且包括语言大模型和多模态大模型。蚂蚁的基础大语言模型也是基于Transformer架构，但采取了跟ChatGPT不一样的Prefix模型结构。基础多模态大模型主要的特色是大语言模型和图文模型进行桥接，原生支持中文、融合文本图像形态，对齐其语义信息，支持多媒体内容理解和搜索推介，对于图像的编辑和生成等。

在此之上，再在不同的领域，包括安全、金融、服务等，建设行业模型，通过行业模型实现产品的落地。

蚂蚁建设了模型数据体系，包括在互联网上通过机器进行大量数据的采集加工，通过高效用工管理和内容标注平台产生高质量的数据，来给模型进行精调，进一步人工强化学习等。蚂蚁自研了精调框架和强化学习框架，还有智能分布式训练引擎和高效分布式的推理引擎，再之上有开放的研发范式，支持蚂蚁内部各业务对于大模型的需求。

从长远上来看，蚂蚁希望推动大模型规模化的产业落地，为此，初步的目标是提升AIGC模型研发的效能和技术的先进性，建设一个可持续发展的AIGC模型的研发范式，一个开发共赢的应用生态，包括建设一流的基础模型、行业模型，实现To C、To B的产品落地。

总结一下，就是从基础大模型到行业大模型、再到产业应用的全栈布局。

图片来源：外滩大会

以金融大模型为例，蚂蚁金融大模型就是基于蚂蚁基础大模型，针对金融产业深度定制。蚂蚁基础大模型平台具备万卡异构集群，其中千卡规模训练MFU可达到40%，集群有效训练时长占比90%以上，RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍，推理性能相较于业界方案提升约2倍。

目前“大模型+知识+服务”的架构已经在蚂蚁内部金融智能化场景上内测，理财侧的专业服务包括理财选品、产品评测、行情解读、资产配置等6大类服务，保险侧的专业服务包括产品解读、家庭配置、智能核保、智能理赔等10多个智能服务。基于金融大模型，还有更贴近个人用户的“支小宝2.0”和“支小助1.0”，提供便捷且丰富的服务。

大模型的迅速崛起和繁荣，不仅是AI发展前沿热点，也加速了人工智能与各行业深度融合，更强大、更通用、更开放的大模型，还有新算法、新应用、新场景不断涌现，正成为产业增长的新引擎和投资创业的新风口。不过，大模型也遇到了一系列的问题和挑战，比如算力能耗、中文公开数据集语料不足、大模型应用安全等，这条路不只是雪厚坡陡，也是道阻且长。