日前,原阿里首席AI科学家贾扬清的一条朋友圈截图在社会化媒体传得沸沸扬扬。截图指出某国产大模型其实是LLaMA架构,只是更换了几个变量名而已。
这也不是业内人士第一次发声质疑,在几个月前的Waves大会上,中国人民大学高瓴学院卢志武教授也曾表示,所谓“国产大模型的春天”,不过是很多公司在“微调国外底座模型”的假象。
虽然后续也有其他学者表达了不同的看法,但争论之下,一条有关大模型的暗线已然浮出水面大模型,越多越好吗?
关于这样的一个问题,创始人、董事长兼首席执行官李彦宏在11月15日举行的深圳2023西丽湖论坛上给出了自己的答案:
“人类进入AI时代的标志,是出现大量的AI原生应用,而不是出现大量的大模型。”
以去年11月底的横空出世为分界线,国内大模型发展经历了从寒冬到盛夏的两级反转。不只是阿里、百度等巨头公司,慢慢的变多的勇于探索商业模式的公司开始涌入这个赛道:截止今年10月,国内已经发布了238个大模型,而6月份的时候这一个数字是79个,相当于4个月就翻了3倍。
但正如开头专家们所质疑的,大模型的风口并不好追。大模型的颠覆性来自其“智能涌现”的能力:简单解释就是触类旁通,通过训练,即便是没有教过的东西,大模型也会。以百度的文心一言为例,在此前的演示中,当李彦宏要求其现场根据一些关键词为一辆生成广告时,文心一言仅仅花了三分钟就生成了竖版广告、5条文案和一段30秒的数字人广告。
获得这样能力的前提是模型的参数规模足够大,训练数据量足够多还可以不断投入,进行迭代。
一方面,这决定了大模型是典型的资金密集型赛道,要开发好用、可用的大模型,存在很高的技术和成本门槛。据OpenAI联合创始人布罗克曼等测算,训练大模型消耗的计算量,每 3、4 个月会翻一倍。据多位业内人士估算,OpenAI 训练 GPT-3 一年,仅算力成本就有 2000 万美元。
另一方面,这也使得缺乏“智能涌现”能力的专用大模型难言价值。在会上,李彦宏曾提到一个现象,很多行业、企业,甚至很多城市都在买卡、囤,建立智算中心,想要从头训练自己的专用大模型,但大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专有知识相结合。大模型更通用,但是成本高,小模型虽然只能应对特定场景的任务,但胜在成本低,实时性较强。在训练的过程中,大模型可以帮助小模型提升快速生成、标记样本的能力,而小模型则帮助大模型快速收敛,从而提升算法性能。
一个例证在于,文心大模型的API调用量。李彦宏表示:“自从8月31号开放以来,文心大模型的API调用量,呈现了指数级的增长。国内有200多个大模型,文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。”
读到这里其实显而易见,大模型本质是一个基础底座,有些类似pc时代的Windows操作系统或者移动互联网时代的安卓或者ios系统。它的门槛和特性决定了,未来的竞争格局一定是一到两个技术底座占据行业的统治地位。这也是怎么回事李彦宏会强调:“不断地重复开发基础大模型是对社会资源的极大浪费”。
业界之所以把大模型视为第四次工业革命真正进入快车道的标志,是期待其所带来的效果和效率的跃迁。
还是以百度的文心大模型为例,自今年三月正式对外发布后基于文心大模型3.0的文心一言产品后,上个月,百度又发布了文心4.0版本。和前代相比,4.0是迄今为止最强大的文心大模型,在理解、生成、逻辑和记忆四大能力上,都有明显提升。比如,在生成能力上,文心一言除了生成文字内容,更包括了图片、视频、数字人等多模态内容,可实现的创作体裁超过200种,涵盖了几乎所有写作需求。在逻辑和记忆能力上,相比之前的版本也有了成倍提升。
但和过去诞生的许多新技术一样,大模型也要解决应用场景的桎梏,寻找兑现商业经济价值的路径。就如同pc时代改变我们办公、游戏方式的软件,以及在根植于移动终端的抖音、微信这样的应用一样,同样具备技术底座属性的大模型若无法形成繁荣的生态,那么也就难言价值。这也是大模型真正的价值锚点所在。
李彦宏在会上表示,“AI原生时代,我们应该的是100万量级的AI原生应用,而不是100个所谓的大模型。”
这需要从业者们一起努力。比如李彦宏提到一个情况,和国内百模大战的情况相比,国外虽然涌现了几十个基础大模型,但对于AI原生应用的探索也很火热,目前已经有上千个AI原生应用。例如微软、Adobe都依据自己业务推出了相对应的AI原生应用。
发力生态建设也是百度一直在做的事情, 目前百度智能云千帆大模型平台2.0月活企业数近万家,覆盖了金融、教育、制造、能源、政务、交通等多个行业的400多个场景,拥有了800万AI开发者。
无论是PC时代还是移动网络时代,技术变革往往也代表着那些大机会,比如通讯、娱乐、购物、工作等。这些人们最本质的需求往往会因为技术而焕发新的形式和生机,就好比当人们满足于互联网时代的图文阅读模式时,一定不会想到未来有一个叫抖音的APP改变了数以亿计人群的娱乐方式。
正如李彦宏所言,直到今天,无论是中国也好,美国也好,最好的AI原生应用还有没出现。就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样,AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。
也因此,对于大模型从业者们而言,和花大力气用于开发大模型相比,如何做出更好的AI原生应用显然是更大的机会。
在此前的百度世界大会上,李彦宏曾表示“公司竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了。”
和这段发言相印证的,是过去 7 个月里,百度在大模型方面的推进速度文心大模型大大小小的更新有数十次,提出了多个大模型生态计划,率先向全社会开放了大模型应用。
首先是CEO对于业务驱动的关键作用。现在AI和大模型会成为新的变革技术几乎慢慢的变成了共识,咨询机构麦肯锡预测:大模型和它掀起的生成式人工智能有望为全球经济贡献约 7 万亿美元价值。
但是作为企业该怎么样拥抱AI时代呢?李彦宏表示,虽然许多企业上上下下都很重视这次机会,但对于问题的本质了解不深,“认为自身搞个基础模型,或者按照网上传播的评测方法来挑选一款评分高的大模型,就是拥抱AI时代了”。
实际上,大模型有没有对网络公司的DAU、时长、用户留存这些指标产生正向影响,有没有对企业的收入、利润、成本产生一定的影响,才是问题的本质,而这些是只有CEO才会关心的问题,做最对自己最合适公司业务的选择。
其次,强大的基础大模型,是AI原生应用的底层驱动力,而AI原生应用则会带动市场,倒逼市场变化。
基于自家的文心大模型,百度不仅把旗下各产品线进行了AI原生化重构,也孵化了全新的AI原生应用。比如智能代码助手Comate。百度现在每新增100行代码,就有20行是AI生成的。同时,得益于智能化的提升,AI原生化重构后的产品也取得了新的进展,比如的付费率提升明显。
这里李彦宏举出新能源汽车去做类比:“中国新能源车在全球的市场占有率达到65%。因为国家政策扶持的就是应用端,通过减免车辆购置税,上路不限号不限行等手段,有效拉动了新能源汽车产业的迅速增加。AI产业也是需求驱动,所以应该是在需求侧、应用层发力,就像补贴新能源汽车用户一样,鼓励企业调用大模型来开发人工智能原生应用,用市场推动产业高质量发展。”
如果说此前几次工业革命,中国的主题是错过和追赶,那在大模型风起的当下,我们起码已经和国外站在了同一个起跑线。在这场竞争中,我们有足够的技术和资源去做比拼,而更值得思考的,则是选择一条怎样的路。和百模大战相比,通过类比过去的技术浪潮,强调AI 原生应用或许是一个更好的路径。