ChatGPT的诞生,在由于解放人类生产力的潜力,人工智能领域发生了重要变化,从用户到投资者,引起了各行各业的广泛关注。1月30日,有消息称,百度将于3月在中国推出类似ChatGPT的人工智能聊天机器人程序。随着微软、百度等巨头的加码,AIGC(人工智能自动生成内容)领域可能成为2023年世界上最受关注、最受欢迎的赛道。虽然ChatGPT甚至整个行业与真正成熟的商业化还有差距,但从ChatGPT的幕后故事中,我们仍然可以看到它将如何影响科技、商业和人类社会的发展过程。
在一代人的时间里,总会有一些产品,从工程部昏暗的地下室,青少年书呆子难闻的卧室,或者有一定爱好的孤僻家庭诞生的技术,成为每个人都会使用的工具。网络浏览器诞生于1990年,但直到1994年(NetscapeNavigator)大多数人才开始探索互联网。MP3播放器在2001年iPod诞生之前并没有引发数字音乐革命。同样,2007年,苹果(Apple)在iPhone诞生之前,智能手机已经问世,但并没有为智能手机开发应用。
2022年11月30日,人工智能领域也可能迎来与网景导航员问世同样重要的关键时刻。
OpenAI首席执行官山姆·阿尔特曼宣布了这一刻的到来。OpenAI成立于2015年,由埃隆·马斯克、彼得·泰尔和其他PayPal成员以及Linkedin联合创始人雷德·霍夫曼等硅谷老板投资。11月30日,公司成立约7年后,阿尔特曼发微博说:“今天我们发布了ChatGPT。点击此处与之聊天。“任何人都可以通过推文中的链接注册账号,开始与OpenAI的新聊天机器人免费聊天。
这引起了各界人士的兴趣。人们不仅与之沟通天气状况。根据软件公司首席执行官和工程师阿姆贾德·马萨德的要求,检查了程序代码的漏洞。美食博主和网络名人吉娜·霍摩尔卡要求它写一份健康的巧克力饼干食谱。Scale 人工智能公司的工程师赖利·古德赛德要求它写一集《宋飞传》(Seinfeld)的剧本。营销人员、一家在线人工智能美术馆的经营者盖伊·帕森斯要求他为他写提示,然后输入另一个人工智能系统Midjourney,然后转换成图像。斯坦福大学医学院(StanfordUniversity School of Medicine)从事人工智能医学应用研究的皮肤病学家罗克珊娜·丹妮休向他提出了医学问题。许多学生用它来完成家庭作业。所有这些都发生在聊天机器人发布后24小时内。
以前还有其他聊天机器人,但没有一个能和ChatGPT相提并论。ChatGPT可以进行漫长的对话,回答问题,并根据人们的要求撰写各种书面材料,如商业计划、广告材料、诗歌、笑话、计算机代码和电影剧本。当然,它并不完美:它提供的结果往往不够准确;它不能引用信息源;而且,它几乎不知道2021年以后发生了什么。虽然它提供的结果通常足够流畅,可以通过高中甚至大学课堂,但它不能像人类专家的表达那样仔细考虑。另一方面,ChatGPT生成内容通常只需要一秒钟左右,而且它生成的很多内容并没有想象的那么糟糕。在ChatGPT发布后5天内,超过100万用户聊天机器人,而Facebook花了10个月的时间才达到里程碑。
在过去的十年里,人工智能技术逐渐扩大了在商业领域的应用,悄然改进了我们日常使用的许多软件,但并没有让非技术用户感到兴奋。ChatGPT的诞生改变了这一点。突然,每个人都开始谈论人工智能将如何颠覆他们的工作、公司、学校和生活。
ChatGPT是相关人工智能技术浪潮的一部分。该技术统称为“生成人工智能”,还包括流行的艺术生成模型,如Midjourney和Lensa。OpenAI位于科技行业“下一个重大事件”的前沿。它具有传奇初创企业的特点,包括全明星团队和投资者。据说该公司的估值已达到290亿美元。
该公司最近的突然走红引起了嫉妒、怀疑和恐慌。谷歌(Google)利润丰厚的搜索帝国可能会受到影响。据媒体报道,谷歌内部已经拉响了“红色警报”,以应对ChatGPT。但令人惊讶的是,OpenAI能够成为超级科技公司俱乐部的成员。几年前,它甚至不是一家公司,而是一个致力于学术研究的小型非营利性实验室。公司仍然坚持保护人类文明、防止不受限制的人工智能威胁等崇高的创造原则。与此同时,OpenAI经历了内部转型,导致原团队分裂,公司逐渐将重点从纯科研项目转移到商业项目。(一些批评者认为,发布ChatGPT本身就是一种危险的行为,这表明OpenAI的商业模式发生了巨大的变化。)
图片来源:IAN C. BATES—THE NEW YORK TIMES/REDUX
“我认为最好的情况是难以想象的。。。谈论它的人会认为这个人是个疯子。我认为最糟糕的情况是我们都死了。”
——OpenAI联合创始人兼首席执行官山姆·阿尔特曼
OpenAI和微软(Microsoft)扩大合作的消息最近宣布,微软将向该公司投资100亿美元作为回报。未来几年,软件巨头将获得OpenAI的大部分利润。这笔交易可能会让外界更加确信,一个曾经理想主义的职业现在只关心盈利。尽管如此,《财富》杂志掌握的文件揭示了OpenAI目前尚未盈利的经营状况。
37岁的联合创始人兼首席执行官阿尔特曼充分体现了OpenAI谜的特点。阿尔特曼作为一名高级科技企业家,更为人们所熟知的是他出色的商业天赋,而不是他的工程技术成就。他是OpenAI估值飙升的驱动力,也是向该技术泼冷水的主力军。他曾公开表示,ChatGPT距离真正可靠还有很大差距。与此同时,他认为该技术是实现公司使命的重要一步。该公司有一个堂吉诃德的使命,即开发计算机超级智能,也被称为通用人工智能(AGI)。“通用人工智能对人类生存至关重要,”阿尔特曼在7月份说。如果没有更好的工具,我们将面临极其严重的问题。”
对于一个盈利的企业来说,这种指导理念是不寻常的,尤其是一些计算机科学家认为阿尔特曼的痴迷纯粹是幻想。加州大学伯克利分校(University of California at Berkeley)计算机科学家本·雷希特说:“通用人工智能是一个愚蠢的想法。在我看来,它是虚幻的。”
然而,通过发布ChatGPT,阿尔特曼迷上了OpenAI及其宏大的人工智能使命。问题的关键在于他与微软的合作能否解决ChatGPT的缺点,利用其先发优势改变整个科技产业。谷歌和其他科技巨头正在努力开发自己的人工智能平台;未来,更完善的软件可能会让ChatGPT看起来像儿戏。OpenAI总有一天会发现,虽然它的技术突破打开了未来的大门,但这个未来与它无关,就像浏览器领域的昙花一现一样。
阿尔特曼在1月中旬的一个星期四晚上罕见地在旧金山公开露面。他上身穿灰色毛衣,下身穿蓝色牛仔裤,脚踏一双时尚明亮的运动鞋,走进一个挤满投资者、技术人员和记者的房间。每个人都想收集与ChatGPT或近期融资相关的信息。当StrictlyVC(一家专注于风险投资的媒体公司)的创始人康妮·洛伊佐斯问他对该公司引起媒体轰动的看法时,阿尔特曼回答说:“我不看新闻。事实上,我不太关注媒体的报道。”
赛富时大厦活动(Salesforce Tower)46楼,房间里挤满了座位。在采访开始前举行的金融技术研讨会上,一位发言人甚至告诉观众,她知道每个人都在“等待山姆·阿尔特曼”。
然而,尽管关于微软投资的谣言引起了各行各业的关注,但阿尔特曼似乎打算冷却这种温暖的气氛。他说:“这些技术有点奇怪,就是虽然令人印象深刻,但并不可靠。所以当你使用第一版演示版时,你会有一个非常深刻的反应:‘哇,真是不可思议,我迫不及待了’。但是用了一百次之后,你会发现它的缺点。”
这种谨慎似乎代表了OpenAI总部的官方态度。该公司总部位于旧金山教会区的一家旧行李箱工厂。事实上,如果ChatGPT是人工智能领域的“网络导航者”,它几乎会提前死亡,因为OpenAI几乎几个月前就停止了这个项目。
ChatGPT的聊天界面支持用户用简单的英语(与其他语言)与人工智能对话。OpenAI最初的想法是把这个界面作为改进它的“大语言模型”(LLM)一种方式。大多数生成式人工智能系统的核心都有一个大语言模型。大语言模型是在大量人工创建文本中应用非常庞大的神经网络。神经网络是一种基于人脑内神经连接的人工智能。该模型从该数据库中学习了一个复杂的统计概率图,代表了在特定语境下出现任何一组单词的统计概率。这样,大语言模型就可以执行大量的自然语言处理任务,如翻译、总结或写作。
OpenAI创建了世界上最强大的大语言模型之一。该模型名为GPT-3,由1750亿个统计联系组成,集中在互联网、整个维基百科全书和两个大型图书数据的三分之二左右进行训练。但OpenAI发现,GPT-很难准确地提供用户想要的结果。一个团队建议使用“强化学习”系统来改进模型。“强化学习”是从试错中学习以最大化回报的人工智能系统。该团队认为,聊天机器人可能是一个很好的候选人,因为以人类对话的形式不断提供反馈,人工智能软件很容易知道它做得很好,需要改进。因此,在2022年初,该团队开始开发这种聊天机器人,即后来的ChatGPT。
开发完成后,OpenAI邀请贝塔测试人员进入行了测试。然而,OpenAI联合创始人兼现任总裁格雷戈·布洛克曼表示,测试人员的反馈令OpenAI失望;人们不知道与聊天机器人交流什么。OpenAI曾经改变了策略,试图开发专业的聊天机器人,希望能帮助特定领域的专业人士。但由于OpenAI缺乏适当的训练专业聊天机器人数据,这个项目也遇到了问题。布洛克曼说,OpenAI决定孤注一掷,向用户发布ChatGPT,让用户自由发展。布洛克曼说:“我承认,我当时的立场是,我不知道它是否会成功。”
OpenAI高管表示,聊天机器人的突然流行让公司措手不及。他的首席技术官米拉·穆拉蒂说:“这让我们感到惊讶。”在旧金山举行的风险投资活动中,阿尔特曼说:“预计它可能会更低——它会导致更低的热度。”
OpenAI首席技术官米拉·穆拉蒂于2022年10月25日参加了《特雷弗·诺亚每日秀》。图片来源:COURTESY OF MATT WILSON/COMEDY CENTRAL’S “THE DAILY SHOW”
ChatGPT不是OpenAI唯一引起热度的产品。虽然公司员工约300人,团队规模较小,但扩大了人工智能的应用范围,使其不仅能简单地分析数据,还能创建数据。另一款OpenAI产品DALLL-E 通过输入几个单词,支持用户生成任何他们想象的物品的模拟图片。现在跟风者已经出现了,包括Midjourney和Stability,开源软件公司 AI。(这些图片生成模型都有缺点。最突出的是,他们倾向于放大训练数据中的偏见,并可能生成种族歧视和性别歧视的图片。)OpenAI还创建了Codex系统,通过微调其计算机代码的GPT大语言模型。该系统可以根据程序员直接语言输入的代码功能预期为程序员编写代码。
OpenAI还有更多的创新准备出发。OpenAI在贝塔测试版GPT-4中采用了更强大的大语言模型,预计今年甚至很快就会发布。阿尔特曼还表示,该公司正在开发一个可以根据文本描述生成视频的系统。此外,1月中旬,OpenAI表示计划发布ChatGPT商业版。付费用户可以通过界面使用聊天机器人,更容易将其整合到自己的产品和服务中。
一些冷眼旁观者可能认为,ChatGPT的发布时间与OpenAI正在进行的一轮大规模融资有关。(OpenAI表示,产品发布的时机纯属巧合。)可以肯定的是,ChatGPT的出现搅动了鲨群出没的水域。它在风险投资行业引发了热烈的追求,风险投资公司希望利用OpenAI高管、员工和创始人非公开出售股权的机会获得公司的股份。
与此同时,微软将在该公司额外投资100亿美元的消息刚刚公布。微软于2016年开始与OpenAI合作,三年前与该公司建立了战略合作伙伴关系,并宣布投资10亿美元。据知情人士透露,该公司的股份已被大量超额认购,尽管微软通过不寻常的投资结构获得了巨大的财务优势。
根据《财富》杂志掌握的文件,微软将有权在新投资完成并OpenAI收回初始资本后获得OpenAI OpenAI披露的20亿美元投资,直到收回130亿美元的投资,包括直到1月份《财富》杂志披露。此后,在软件巨头获得920亿美元利润之前,微软在该公司的持股比例将逐渐下降到49%。与此同时,其他风险投资者和OpenAI员工将有权获得公司49%的利润,直到利润达到1500亿美元。利润达到上限后,微软和投资者的股份将返还给OpenAI的非营利性基金。事实上,OpenAI的做法是将公司租给微软,租期取决于OpenAI的盈利速度。
但收回投资并实现利润上限可能需要一段时间。根据《财富》杂志掌握的文件,到目前为止,OpenAI的收入相对较小,仍处于严重亏损状态。文件显示,该公司去年的收入预计不到3000万美元。但计算和数据支出预计达到4.1645亿美元,人工支出8.931万美元,其他非特定营业费用为3.875万美元。2022年净亏损总额为5.445亿美元,不包括员工股票期权。ChatGPT的发布可能会迅速增加公司的损失。阿尔特曼在twitter上回答了埃隆·马斯克的问题,称用户与chatGPT的每一次互动都将占据openAI“个位数百分比”的计算成本。随着这款聊天机器人的普及,它的月支出可能高达数百万美元。
OpenAI预测,随着ChatGPT成为吸引客户的重要工具,其收入将迅速增长。该公司预计2023年收入2亿美元,2024年收入预计超过10亿美元。但OpenAI并没有预测其支出的增长,以及何时能扭亏为盈。该公司拒绝对这些数据发表评论,但它们指出了一个明显的事实:OpenAI和微软都认为,以前的非营利实验室现在可以用来销售盈利产品。
10亿美元
根据《财富》获得的一份文件,ChatGPT预计2024年收入10亿美元,2023年收入2亿美元,2022年收入3000万美元。
微软已经开始收获双方合作协议的结果。微软在其Azure Cloud平台推出了一系列OpenAI品牌的工具和服务,支持Azure客户使用GPT和DALL-E工具等OpenAI技术。例如,汽车交易平台Carmax推出了可以在这些Azure工具上运行的新服务。
微软人工智能平台公司副总裁埃里克·博伊德表示,它满足了OpenAI大语言平台培训和运营的需求,促进了创新,并将使所有Azure客户受益。例如,微软为人工智能创建了世界上最强大的超级计算集群,并开发了各种软件创新,使大型人工智能模型更容易在这些机器上训练和运行。微软正在将OpenAI技术集成到其许多软件中。微软在其搜索引擎中必须是必须的(Bing)图片创作工具和新设计师图片设计工具都是DALL-E驱动的;在它的power中 Apps软件推出了支持GPT-3的工具,并根据OpenAI的Codex模型开发了代码建议工具GitHub Copilot。
晨星(Morningstar)专注于科技股研究的高级股票研究分析师丹·罗曼诺夫表示,即使与OpenAI的合作关系不会立即影响Azure的收入,它仍然是一个良好的品牌定位和营销。他说:“OpenAI备受关注。微软可以将OpenAI开发的人工智能解决方案应用于Azure并命名为Azure AI,能保持其竞争力。谷歌是微软云服务的竞争对手AWS、IBM、甲骨文(Oracle)、赛富时(Salesforce)等等,都有自己的“认知”服务,但能够与开发ChatGPT的公司合作,利大于弊。
对于微软来说,搜索领域可能会有更大的回报。科技媒体The Information最近报道称,微软计划将ChatGPT集成到必要的响应中,以便用户能够通过与聊天机器人的对话进行深入探索,而不是逐一查看链接。谷歌目前在搜索市场占据主导地位,全球市场份额超过90%。必应虽然排名第二,但与谷歌相去甚远,市场份额仅为3%左右。2022年前9个月,谷歌搜索业务收入为1200亿美元,约占谷歌总收入的60%。ChatGPT可能为微软动摇谷歌的主导地位提供了唯一真正的机会。(The是微软拒绝的 评论Information的报道。)
按照微软的标准,这些积极的回报非常划算。微软在OpenAI的总投资是130亿美元,这确实是一个天文数字。然而,这项投资仅占过去12个月850亿美元税前利润的15%,但它可以获得最近对颠覆性技术的控制。这是一笔成本相对较低的交易。然而,OpenAI和阿尔特曼可能要付出不同的代价:微软的优先任务可能会排除OpenAI自身的优先任务,使OpenAI面临更大的使命风险,降低帮助公司成功的科学家的归属感。
2015年7月的一个晚上,当时是著名初创公司孵化器Y 阿尔特曼,Combinator负责人,位于罗帕克硅谷风险投资中心的牧场风格豪华酒店罗斯伍德桑德希尔酒店(Rosewood Sand Hill)举行私人晚宴。埃隆·马斯克和26岁的麻省理工学院出席了晚宴(MIT)布洛克曼,一名本科生。布洛克曼是Stripe支付处理初创公司的首席技术官。客人中有很多经验丰富的人工智能研究人员,有些人对机器学习知之甚少。但每个人都认为通用人工智能是可行的,他们都非常担心。
谷歌刚刚收购了一家公司:位于伦敦的神经网络初创公司Deepmind。在阿尔特曼、马斯克和其他科技内部人士看来,这是第一家开发通用人工智能的公司。如果Depmind成功,谷歌可能会在这个无所不能的技术领域占据主导地位。罗斯伍德晚宴的目的是讨论建立一个实验室来避免这种情况。
新实验室旨在成为一个与DeepMind和谷歌完全不同的组织。该实验室将是非营利性的,并明确提出将先进人工智能的效益民主化为使命。实验室承诺披露所有研究,开源所有技术,并充分反映公司名称OpenAI中透明度的承诺。实验室里有很多著名的捐赠者,不仅是马斯克,还有他在PayPal的同事泰尔和霍夫曼;阿尔特曼和布洛克曼;Y 杰西卡·利文斯顿,Combinator联合创始人;YC Research基金;印度IT外包公司Infosyss;以及Amazon Web Services。所有创始捐赠者都承诺在这家理想主义的新公司共同投资10亿美元(但税务记录显示,尽管媒体广泛报道了这一承诺,但非营利组织只收到了承诺捐款金额的一小部分)。
但事实很快证明,训练庞大的神经网络成本高,计算成本高达数千万美元。人工智能研究人员的劳动力成本也很昂贵:税务记录显示,俄罗斯科学家伊利亚·萨茨科尔在离开谷歌后加入了OpenAI作为首席科学家,几年前的年薪高达190万美元。几年后,阿尔特曼和OpenAI的其他人得出结论,实验室不能继续以非营利的方式运营谷歌、Meta和其他科技巨头。2019年阿尔特曼对《连线》(Wired)杂志说:“为了成功地完成我们的使命,我们需要大量的资金,远远超出我最初的想法。”
翻译:刘金龙
审校:汪皓
本文的部分内容来自网络,仅供参考。如有侵权行为,请联系删除。