大模型创业，李彦宏公布标准答案

来源 | 伯虎财经（bohuFN）

作者 | 陈平安

日前，原阿里首席AI科学家贾扬清的一条朋友圈截图在社交媒体传得沸沸扬扬。截图指出某国产大模型其实是LLaMA架构，只是更换了几个变量名而已。

这也不是业内人士第一次发声质疑，在几个月前的Waves大会上，中国人民大学高瓴人工智能学院卢志武教授也曾表示，所谓“国产大模型的春天”，不过是很多公司在“微调国外底座模型”的假象。

虽然后续也有其他学者表达了不同的看法，但争论之下，一条有关大模型的暗线已然浮出水面——大模型，越多越好吗？

关于这个问题，百度创始人、董事长兼首席执行官李彦宏在11月15日举行的深圳2023西丽湖论坛上给出了自己的答案：

“目前中国的大模型太多，而模型之上开发的AI原生应用太少。”

“人类进入AI时代的标志，是出现大量的AI原生应用，而不是出现大量的大模型。”

01 大模型狂飙

要想回答开头的问题，首先需要搞清楚，我们需要怎样的大模型。

以去年11月底 ChatGPT的横空出世为分界线，国内大模型发展经历了从寒冬到盛夏的两级反转。不只是阿里、百度等巨头公司，越来越多的创业公司开始涌入这个赛道：截止今年10月，国内已经发布了238个大模型，而6月份的时候这个数字是79个，相当于4个月就翻了3倍。

但正如开头专家们所质疑的，大模型的风口并不好追。大模型的颠覆性来自其“智能涌现”的能力：简单解释就是触类旁通，通过训练，即便是没有教过的东西，大模型也会。以百度的文心一言为例，在此前的演示中，当李彦宏要求其现场根据一些关键词为一辆新能源汽车生成广告时，文心一言仅仅花了三分钟就生成了竖版广告、5条文案和一段30秒的数字人广告。

获得这样能力的前提是模型的参数规模足够大，训练数据量足够多并且能够不断投入，进行迭代。

一方面，这决定了大模型是典型的资金密集型赛道，要开发好用、可用的大模型，存在很高的技术和成本门槛。据OpenAI联合创始人布罗克曼等测算，训练大模型消耗的计算量，每 3、4 个月会翻一倍。据多位业内人士估算，OpenAI 训练 GPT-3 一年，仅算力成本就有 2000 万美元。

另一方面，这也使得缺乏“智能涌现”能力的专用大模型难言价值。在会上，李彦宏曾提到一个现象，很多行业、企业，甚至很多城市都在买卡、囤芯片，建立智算中心，想要从头训练自己的专用大模型，但大模型的产业化模式，应该是把基础模型的通用能力和行业领域的专有知识相结合。大模型更通用，但是成本高，小模型虽然只能应对特定场景的任务，但胜在成本低，实时性较强。在训练的过程中，大模型能够帮助小模型提升快速生成、标记样本的能力，而小模型则帮助大模型快速收敛，从而提升算法性能。

一个例证在于，文心大模型的API调用量。李彦宏表示：“自从8月31号开放以来，文心大模型的API调用量，呈现了指数级的增长。国内有200多个大模型，文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。”

读到这里其实不难发现，大模型本质是一个基础底座，有些类似pc时代的Windows操作系统或者移动互联网时代的安卓或者ios系统。它的门槛和特性决定了，未来的竞争格局一定是一到两个技术底座占据行业的统治地位。这也是为什么李彦宏会强调：“不断地重复开发基础大模型是对社会资源的极大浪费”。

02 大模型的价值锚点

业界之所以把大模型视为第四次工业革命真正进入快车道的标志，是期待其所带来的效果和效率的跃迁。

还是以百度的文心大模型为例，自今年三月正式发布后基于文心大模型3.0的文心一言产品后，上个月，百度又发布了文心4.0版本。和前代相比，4.0是迄今为止最强大的文心大模型，在理解、生成、逻辑和记忆四大能力上，都有明显提升。比如，在生成能力上，文心一言除了生成文字内容，更包括了图片、视频、数字人等多模态内容，可实现的创作体裁超过200种，涵盖了几乎所有写作需求。在逻辑和记忆能力上，相比之前的版本也有了成倍提升。

但和过去诞生的许多新技术一样，大模型也需要解决应用场景的桎梏，寻找兑现商业价值的路径。就如同pc时代改变我们办公、游戏方式的软件，以及在根植于移动终端的抖音、微信这样的应用一样，同样具备技术底座属性的大模型如果不能形成繁荣的生态，那么也就难言价值。这也是大模型真正的价值锚点所在。

李彦宏在会上表示，“AI原生时代，我们需要的是100万量级的AI原生应用，而不是100个所谓的大模型。”

这需要从业者们共同努力。比如李彦宏提到一个情况，和国内百模大战的情况相比，国外虽然涌现了几十个基础大模型，但对于AI原生应用的探索也很火热，目前已经有上千个AI原生应用。例如微软、Adobe都根据自身业务推出了相对应的AI原生应用。

发力生态建设也是百度一直在做的事情，目前百度智能云千帆大模型平台2.0月活企业数近万家，覆盖了金融、教育、制造、能源、政务、交通等多个行业的400多个场景，拥有了800万AI开发者。

无论是PC时代还是移动互联网时代，技术变革往往也意味着那些大机会，比如通讯、娱乐、购物、工作等。这些人们最本质的需求往往会因为技术而焕发新的形式和生机，就好比当人们满足于互联网时代的图文阅读模式时，一定不会想到未来有一个叫抖音的APP改变了数以亿计人群的娱乐方式。

正如李彦宏所言，直到今天，无论是中国也好，美国也好，最好的AI原生应用还有没出现。就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样，AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。

也因此，对于大模型从业者们而言，和花大力气用于开发大模型相比，如何做出更好的AI原生应用显然是更大的机会。

03 如何迎接AI时代

在此前的百度世界大会上，李彦宏曾表示“企业竞争，不是大鱼吃小鱼，而是快鱼吃慢鱼，比竞争对手更快决策，很可能你就赢了。”

和这段发言相印证的，是过去 7 个月里，百度在大模型方面的推进速度——文心大模型大大小小的更新有数十次，提出了多个大模型生态计划，率先向全社会开放了大模型应用。

这里的逻辑有两个。

首先是CEO对于业务驱动的关键作用。现在AI和大模型会成为新的变革技术几乎已经成为共识，咨询机构麦肯锡预测：大模型和它掀起的生成式人工智能有望为全球经济贡献约 7 万亿美元价值。

但是作为企业应该如何拥抱AI时代呢？李彦宏表示，虽然许多企业上上下下都很重视这次机会，但对于问题的本质了解不深，“以为自己搞个基础模型，或者按照网上传播的评测方法来挑选一款评分高的大模型，就是拥抱AI时代了”。

实际上，大模型有没有对互联网公司的DAU、时长、用户留存这些指标产生正向影响，有没有对企业的收入、利润、成本产生影响，才是问题的本质，而这些是只有CEO才会关心的问题，做最适合自己公司业务的选择。

其次，强大的基础大模型，是AI原生应用的底层驱动力，而AI原生应用则会带动市场，倒逼市场变化。

基于自家的文心大模型，百度不仅把旗下各产品线进行了AI原生化重构，也孵化了全新的AI原生应用。比如智能代码助手Comate。百度现在每新增100行代码，就有20行是AI生成的。同时，得益于智能化的提升，AI原生化重构后的产品也取得了新的进展，比如百度文库的付费率提升明显。

这里李彦宏举出新能源汽车去做类比：“中国新能源车在全球的市场份额达到65%。因为国家政策扶持的就是应用端，通过减免车辆购置税，上路不限号不限行等手段，有效拉动了新能源汽车产业的快速增长。AI产业也是需求驱动，所以应该是在需求侧、应用层发力，就像补贴新能源汽车用户一样，鼓励企业调用大模型来开发人工智能原生应用，用市场推动产业发展。”

如果说此前几次工业革命，中国的主题是错过和追赶，那在大模型风起的当下，我们起码已经和国外站在了同一起跑线。在这场竞争中，我们有足够的技术和资源去做比拼，而更值得思考的，则是选择一条怎样的路。和百模大战相比，通过类比过去的技术浪潮，强调AI 原生应用或许是一个更好的路径。

毕竟就在当下，如何平衡收入和支出，已经成为大模型企业们头疼的问题。

本文来自投稿，不代表增长黑客立场，如若转载，请注明出处：https://www.growthhk.cn/quan/109143.html