生成式AI，能否生成百度的未来？-链未来

原文来源：光锥智能

作者：刘雨琦

图片来源：由无界AI生成

大风始于青萍之末，命运的偶然和必然经常会纵横交织在一起。

2019年，是整个人工智能历史上，最为晦暗的一年。继2016年AlphaGo打败李世石，2017年Tansformer架构横空出世使得技术大规模爆发，2018年的创业热潮之后。2019年，资本退潮、技术瓶颈期、场景难落地，开启了人工智能史上的“乱纪元”。

没有人知道通用人工智能何时到来，就像三体人不知道太阳会在何时升起。

那一年，大批AI公司陷入裁员风波、资金链断裂、产品难产，能坚持至今的，所剩寥寥。

但也正是在2019年，AI新的希望开始孕育：OpenAI在7月接受了微软的投资并与其深度合作，如今让世人震惊的GPT-3正是从那一年开始研发；国内最早树立AI战略的百度，从年初就开始进行了一次长达半年的人事调整，如今看来，重新排兵布阵，似乎是开启了长达4年的坚守期。

2019年，王海峰晋升为集团CTO，继续担任AI技术平台体系（AIG）和基础技术体系（TG）总负责人，两者是百度最重要的技术底座；沈抖晋升为高级副总裁，全面负责移动生态事业群，随后在2022年又调任至百度智能云，成为百度第二增长曲线的开拓者；而在2019年引进的一批新生力量中，何俊杰是唯一一名80后百度副总裁，先是负责投资并购和战略投资，后又被重用，负责沈抖空缺出来的移动生态事业群，实权更加在握。

时间来到了2023年，Transformer的能力在这一年终于由OpenAI打破了天花板，进阶到一个新的层次，技术的突破让OpenAI一举成为全世界最受瞩目的公司。微软盖过了谷歌的科技光辉。

在过去四年里，百度的核心业务形成了由沈抖领军智能云，何俊杰负责移动生态，王海峰压阵技术的三角结构，百度也终于结束了静默期，开始转守为攻，动作不断。

“重新把每个应用都做一遍”，是经历了半年蓄力后的第一次亮剑，如今的百度像一颗行星，即将遇到巨大的“技术引力场”，而彻底改变轨道。

大模型涌现前夜

2017年，谷歌在一篇名为《Attention Is All You Need》的论文中，提出了Transformer架构，以替代传统的RNN和CNN循环模型，论文中展示了Transformer的训练准确性高于之前所有模型，训练时间明显低于之前的模型，在训练集内容较少时训练效果也很好。

这之后，Transformer架构迅速被接受并应用在了NLP和CV领域，尤其在NLP领域，注意力机制让机器能够更准确地理解语义并生成，以及减少信息重复。

作为最早一批发现并跟进Transformer技术路线的公司，百度已经在NLP领域研究超过十年之久，并已经组成了一支由王海峰、吴甜、吴华等顶尖专家组建起来的精悍的NLP队伍。

王海峰

彼时，NLP团队成立的第一个重要任务，是打造百度翻译。王海峰将深度学习和神经网络大胆应用在翻译中，加强机器对上下文的理解，形成更流畅的译文。这一勇敢尝试也让百度翻译成为第一个支持200多种语种的翻译系统，甚至比Google还早了一年零3个月。

这也是大模型四大核心能力“理解、生成、逻辑、记忆”中，理解能力的雏形。

但王海峰觉得，NLP还不够。他专门跑到李彦宏办公室去做汇报，提出了下个“登陆的诺曼底”——语音识别。他的理由是，语音识别技术马上要到产业化的临界点，一旦突破很快就会大规模商用。

李彦宏凭借着自己对技术的判断，决定再次支持王海峰，陆续建立了与NLP部门平行的“语音识别部门”、“图像识别部门”和“知识图谱部门”。

王海峰的一通操作让很多百度的同学不解，“这些技术和百度现在的产品也没关系啊，一股脑创建这么多部门，是攒着过年么？”

彼时的王海峰，正是看到了搜索数据对于大模型形成逻辑有着非常强大的支撑。“百度有世界上最大的搜索引擎，搜索引擎不仅信息时效性很强，也有很高的准确率，可以构建最全的知识图谱”，王海峰曾在公开采访中解释道。

在打造文心一言之前，百度沉淀了拥有超过50亿实体、550亿事实的多元异构超大规模的知识图谱，能够通过语言、听觉、视觉等获得对世界的统一认知。其在2021年发布的知识增强大模型——ERNIE(文心)3.0，正是文心一言的前身，该项目由吴甜主要负责。

吴甜

又是2019年，百度文心1.0发布，在4年时间里迭代了3个版本。2022年11月，吴甜在公开峰会中同时公布了文心已经累计的11个行业大模型，涵盖电力、燃气、金融、航天等领域，产业生态初步形成。

这些，都为百度抢先发布文心一言做了伏笔和铺垫。3月16日，文心一言发布之后，百度再次回到镁光灯下，但比肯定更多的，是质疑。

“市场需求这么旺盛情况下，谁先做出来还是意义非常大的”，李彦宏曾在采访里讲到，即便产品并未完全成熟，但仍然要发布的原因：“文心一言发布之后，无数的人，过去不怎么联系或者行业跟我隔得很远的人都在问，我们怎么能跟百度合作，怎么尽早试用”。

从技术的角度，大模型更是“越用越灵”的高速迭代。“内测的时候，员工问，文心一言怎么藏头诗写不好？我说等等吧，明后天估计就能学会了，结果第二天果然就能用了，大模型的进步也是一个不断学习的过程”，王海峰笑道。

在半年时间里，文心一言从3.0到3.5，再到4.0版本进行了三次迭代，据王海峰在会上介绍，文心一言用户规模已经达到4500万，开发者5.4万、场景4300个、应用825个、插件超过500个。

在NLP浇的水，施的肥，终于在2023年迎来了丰收，也正如李彦宏所讲，技术发展的路径，是“一生二、二生三、三生万物”的过程。

大模型背后的内功

通用人工智能爆发之后，云计算的关注度和企业重视程度到了顶峰，也随即来到了“iPhone时刻”。

大模型的出现，产生了巨大的算力缺口，云计算既为大模型提供云算力支撑，又是大模型落地企业的最佳着落点，无论是百度还是任何一家拥有大模型的企业，当大模型面世，下一步的重点便是推向市场，让企业用起来。

对于百度而言，这样的重担，落在了沈抖肩上。

沈抖

在百度的六大事业群负责人中，除了CTO王海峰，沈抖是唯一一个高级副总裁。虽然同为技术出身，但和王海峰的“工程师”角色不同，沈抖从加入百度开始，就一直在负责关键业务的增长。

加入百度的10年里，沈抖先后整合了广告投放系统，提高了系统变现能力；将搜索和feed信息流进行结合；整合了由搜索升级后的移动生态事业群，补齐了百度移动生态的版图。

如果说，王海峰打造了一把尖刀，那沈抖则是能利用这把尖刀，开拓疆土的先锋官，用李彦宏的话说是“敢打硬仗、能打胜仗”。

2022年5月，沈抖轮岗为百度智能云（ACG）事业群总裁。于百度而言，最开始并没有全力押注云计算，但也正是随着人工智能技术的不断发展，让百度意识到了云计算短板后，开始暗自发力，默默培养第二增长曲线。

由于没有先发优势，百度云过去10年的目标都十分明确，不和“老炮”们比拼IaaS层的规模化，而是通过PaaS＋SaaS与智能化能力的结合，打出差异化，并以小搏大地切入企业数字化。

2023百度世界大会上中，沈抖再次提出“云智一体”战略：“人工智能与云计算的深度结合是企业快速落地AI原生应用的关键。目前，百度集团所有应用和服务全部基于‘云智一体’技术架构运行在百度智能云上”。

据光锥智能观察，云智一体战略的核心在于，一方面，以百度智能云为依托，可以快速为企业提供整套的大模型服务；另一方面，大模型也推动着企业数字化的门槛变得更低。

在接手ACG后的5个月里，沈抖针对企业在大模型时代的核心需求，迅速整合出了“大模型服务超级工厂”——文心千帆，并按需求将用户分为五大类用户。

首先，针对算力资源所产生的需求缺口，千帆平台提供各类异构算力。比如在耗费最多训练环节，通过分布式并行训练和微秒级互联能力，千帆平台可以实现万卡集群训练加速比达到95%，有效训练时间占比达到96%，大幅降低客户算力和时间成本。

其次在模型层面，对于希望直接调用已有大模型的客户，企业可快速调用包括文心一言在内的多个大模型，同时千帆平台提供中文增强、性能增强、上下文增强等工具。据沈抖透露，目前千帆平台已经服务超过1万7千家客户。

针对有二次开发需求的客户，千帆平台为大模型提供再训练、微调、评估和部署等全生命周期工具链，业界最多的41个高质量行业数据集，并针对自身业务场景快速优化。

大会现场还进行了如何基于检索增强生成（RAG，Retrieval Augmented Generation）框架，为三一重工快速开发知识问答应用的实操演示：只需在千帆AI原生应用工作台中选择预置的RAG框架，进行相应的参数配置等工作，就可以快速实现三一重工官网智能客服应用的开发与上线。

沈抖表示，搭建这样一个“小助手”，即使需要处理几千篇万字长文档，成本也只需几百块钱；而之后用户每次咨询，成本仅需几分钱。

一直以来，大型工业、制造业、农业都是数字化的深水区，核心原因就在于产业的复杂性导致了数字化的门槛高，难以落地。

但通过大模型，既降低了使用门槛，也降低了使用成本。不需要打造任何新系统，也不需要人工参与，是技术组件的一个更高级的应用方式，二者结合，也转起了云智一体的飞轮，逐步蓄力。

大模型的创新挑战

过去已成定局，未来却可以改变。

所有拥有了大模型的厂商，都发现了应用层的机会。微软在3月份就开始动刀包括Bing、Office、Windows系统在内的全线产品，阿里张勇讲道：“要用大模型把所有产品重做一遍”，然而这句话，说起来简单，做起来却是大模型时代最大的创新挑战。

AI如何重构应用？这不仅要业务能力，更需要想象力，面对一个新的AI时代，百度也将指挥棒交到了年轻人手里。

2022年5月之后，接替沈抖作为MEG事业群负责人的，是百度人才梯队建设计划中引入的80后副总裁——何俊杰。如果说沈抖是“硬战派”，那何俊杰就是名副其实的“少壮派”。正如任正非所说，要“让听到炮声的人指挥战斗”。

重构应用，是不破不立，对比来看，百度对自己，确实“下手特别狠”。

百度世界大会，围绕“生态”，何俊杰交出了“移动生态”、“内容生态”和“商业生态”的答卷。

其中，移动生态涵盖了“新搜索”、“新文库”、文心一言APP、百度电商“慧播星”等AI原生应用；内容生态层面，通过百度APP“AI编辑器”等一系列应用为创作者生态赋能；商业生态层面，推出AI Native营销平台“轻舸”。此外，何俊杰还公布了文心一言插件生态——“灵境矩阵”，现已全面开放。

百度所定义的新搜索，正是延续了2010年李彦宏提出的框计算的逻辑。具备极致满足、推荐激发和多轮交互三个特点。即用户搜索问题时，“不再给你一堆链接”，而是通过对内容的理解，生成文字、图片、动态图表等多模态答案；推荐激发则可以实时推荐用户关心的问题；在针对复杂需求时，多轮交互可以通过提示、调整等方式，满足用户个性化的搜索需求。

需求到匹配的过程，也称之为“端到端”搜索，但这会打破百度曾经赖以生存的竞价排名模式，广告收入也是一直以来百度最大的现金牛，自己革自己的命并不简单，百度后面还有一场硬仗要打。

AIGC的能力让一部分百度老应用有了新的活力，比如百度文档从内容检索工具升级为了内容生产工具、百度编辑器成为了内容生成工具；另一部分也探索了新的场景，比如百度轻舸通过AIGC一站式生成营销内容并智能投放，结合数字人生成平台“慧播星”帮助商家扩大营销范围和场景。

同时，随着大模型应用的逐步落地，百度也意识到凭借一己之力终究有限，无限的是合纵而连横。

这正是灵境矩阵的价值所在，这一平台大大降低了大模型插件开发的成本，让有创意、有想法的普通人，也能成为插件开发者。李彦宏表示，插件是一种特殊的AI原生应用，也是门槛最低，最容易上手的AI原生应用。

插件的特点在于“万能接口”，既可以连接搜索、小程序、内容平台也可以连接任何入口，这样“即插即用”的使用方式，能让开发者、创作者快速加入到生态中。

何俊杰透露，上线一个月，灵境矩阵已经收到2.7万个开发者注册申请，覆盖了20多个垂直领域，其中包括企业、机构和个人开发者。

一位百度内部人士告诉光锥智能：“应用层的大模型插件以灵境为主要平台，会放在文心一言和百度App中。千帆更偏底层调用，灵境更偏上层，甚至未来有可能在应用插件层面会替代千帆”。