图片来源:由工具生成
编者按:生成式人工智能(GenAI)势头非常快,似乎所有的白领市场都可以使用 GenAI 再做一遍。每个人都在摩拳擦掌,但你最好先冷静下来,想想你是否真的能找到黄金。或者也许你确实找到了黄金,但你发现买镐和铲子的钱还不够。本文对此进行了全面的库存。这篇文章来自于编译。
生成式 AI 淘金热的飙升开始了。你系好安全带了吗?科技巨头会拿起自己的镐和铲子来统治市场吗?哪些初创企业会发财?"X 的 copilot“会成为寻找富矿的商业策略吗?初创公司应该如何竖起高墙来阻止其他探矿者?美国能再次拥有储量最丰富的金矿吗?
生成式 AI 淘金热如火如荼。生成人工智能 (GenAI) 现在可以创建各种内容,如文本、图像、视频和音频,质量通常与人类创建的内容没有什么不同。视觉设计、编码、营销、游戏制作、音乐创作和产品设计 GenAI 其中几个领域对人类创造力的影响很快。集成创意服务 Microsoft Office 365、Slack、Discord、Salesforce Cloud 和 Gmail 等待产品,在我们不知不觉中,GenAI 将数十亿人的生产力提升到一个新的水平。我们很快就会使用它 GenAI 创建我们的初稿。
那么谁能靠 GenAI 赚钱?我向。我向 OpenAI 的 Dall-E-2 文本生成图像服务提出了这个问题,它为我生成了以下图像。还不错。
给 Dall-E-2 提示:“谁将从生成式开始? AI 中赚钱?”
2018 2000年,我写了一篇热门的博文,讨论谁能在人工智能领域赚钱。这篇文章是我在的 GenAI 后续文章吸引了数十亿美元的投资和数千个新用例。本质上,在这场淘金热中可以捕捉到价值的可以分为五个“层次”:
- 基础设施层-提供芯片和云基础设施的公司将运行大量底层 GenAI 计算机模型。
- 基本模型-公司开发了文本、图像、音频等生成创意输出的大模型。
- 应用程序-正在开发创造性应用程序的大小公司将被消费者、企业和政府使用。
- 行业和组织——作为自身创造性活动的一部分,各行业和组织将从 GenAI 在应用程序、工具和平台中沉淀价值。
- 建立、出口和部署国家-在国内和跨国界 GenAI 技术国家。
©生成式 AI 五个层次的价值捕获
那么这 5 分别会有哪些赢家?
1、GenAI 基础设施
科技巨头凭借自己的云服务和硬件芯片,已经在那里 GenAI 基础设施层占主导地位。
将提供 GenAI 基础设施科技巨头和芯片公司的例子
微软和谷歌在美国云计算市场处于有利地位,而百度和阿里巴巴在中国处于有利地位。其庞大的超级计算机云计算基础设施可以运行 GenAI 复杂昂贵的文本、视觉和音频模型。许多开发者已经使用了他们的云 AI API 随着企业家的涌入,服务和工具的开发和应用几乎是无限的 GenAI 用例,这一趋势预计将加速。亚马逊对基本模型的态度一直保持沉默,因此如何回应将是一个大问题。
GenAI 用大量的计算能力生成创造性的输出。OpenAICEO Sam Altman 表示:
没有办法,我们必须在某个时候 [ChatGPT 和 Dall-Ee] 货币化;计算机成本太高。”
有传言称,Open AI 训练 GPT-3 光是电耗就花光了 1200 万美元。所以2023也就不足为奇了。 年初,OpenAI 又从微软那里拿到了 100 投资1亿美元,其中大部分将是 Microsoft Azure 以超级计算基础设施访问点的形式出现。
芯片制造商对超级计算机能力的需求垂涎三尺。NVIDIA(纳斯达克股票代码:NVDA)市值已超过 5000 1亿美元,股价已经从 2018 年的 60 美元上涨至 2023 年初的 240 美元。科技巨头也在投资自己的专为 AI 优化芯片。美国最近禁止向中国出口先进的人工智能芯片,这将加快中国对半导体行业的国家援助和国内投资。考虑到所需的投资金额,这一领域的赢家将是大玩家或大玩家支持的人。
科技巨头的规模和业务范围赋予他们发展 GenAI 基本模型的竞争优势。这些模型利用了科技巨头巨大的计算资源,并有大量的数据进行训练。比方说,OpenAI 的 GPT-3 文本模型,即所谓的大型语言模型 (LLM),是基于约 45 TB 训练的文本数据代表了大多数英语互联网的“吸收” 5000 亿个单词。同样地,OpenAI 的 Dall-E-2 文本生成图像模型使用 6.5 训练数亿个图像-标题。
2、基础模型
由于数十亿未能掌握这些基本模型的最终用户在未来产生的巨大收入流,他们在云服务领域失去了领先地位——科技巨头不希望这样的事情发生。微软已经 OpenAI 谷歌最近推出了深度合作 Bard 该模型补充了谷歌的语言聊天机器人 Imagen 模型可以用来根据输入文本创建逼真的图像。
中国科技巨头也没有停滞不前。阿里巴巴正在测试一项内部聊天服务。百度已经提供了 ERNIE-ViLG,文本生成图像的参数模型,目前正在测试一种新的聊天机器人服务。 科技巨头的规模为创业公司提供了一些难以复制的优势。
文本、图像、视频、音频、工具和服务的基本模型提供商示例
科技巨头具有解决基本模型真实性、偏见和毒性问题的规模优势
科技巨头也可能是唯一能应对的人 GenAI 黑暗面的参与者。尽管 GenAI 还处于起步阶段,但基础模型的问题越来越明显。这些问题包括真实性(GenAI 生成的内容完全错误)、偏见(对特定群体的偏见)和毒性(如种族主义、厌女或仇恨言论)。2023 年初,由于谷歌的金融市场, Bard 恐惧聊天机器人服务给出的错误和冒犯性的答案,使聊天机器人服务感到恐惧 Alphabet 市值缩水了 1000 亿美元。限制版微软 Bing 聊天机器人也表明,AI 虽然微软的股价并没有因为越来越多的保护措施而受到挫折,但它将对用户提出的问题做出不安的回应。还有一种叫做提示注入(prompt injections)通过注入恶意指令,新的网络攻击可以绕过护栏。
开发这些基本模型的人面临的挑战是确保输出可靠和准确。基本模型不能简单地复述从广泛的互联网上收集到的偏见和有毒内容。这些模型也有“幻觉”。这意味着他们可以自信地回答可能与事实不一致的问题。正如 Character.AI 联合创始人 Noam Shazeer 《纽约时报》所说的:
“...这些系统不是为真实性而设计的。它们是为似是而非的对话而设计的。”
换句话说,他们是自信的废话艺术家。
科技巨头无法承受模型失败可能带来的声誉、财务和战略风险。他们正在建立监督系统,包括护栏和模型调整。为了建立用户对自己的信任,满足可能的监管要求,科技巨头需要设计模型透明度、可解释性和来源引用的解决方案。加强基于人类反馈的学习 (RLFH) 需要一个真正的人类团队来审查和评估模型对问题的答案。这些简单的问题不能大规模解决。在这一点上,科技巨头仍然处于有利地位,因为其他人无法与他们相比,无论是资金、工程人才、数据集还是数十亿用户带来的人类反馈循环的规模。
科技巨头的模型可能不适合所有情况
尽管规模巨大,但科技巨头无法垄断基础模型层面的所有市场。他们的模型通常是水平的,非常适合回答你能想到的任何消费者问题,尽管它们可能无法正确回答。然而,这些模型可能并不总是能够满足企业对垂直任务的需求。为什么? 因为科技巨头的横向模型 (1) 不一定总是在执行专业任务方面表现良好(2) 企业的专有数据往往无法保护,(3) 没有接受过非英语语言训练,(4) (5)缺乏透明度和可解释性 不适合边缘设备和本地使用,(6) 在他们的云中运行可能非常昂贵,而且 (7) 导致公司依赖科技巨头。
一些资金充足的初创企业正在为科技巨头提供基本模型的替代方案
科技巨头的基本模式并不适合所有人。这为一些资金充足的初创企业留下了空间。这些初创公司筹集了大量资金,如果不是几十亿美元,就有几亿美元。
- Anthropic 成立于 2021 2000年,专注于更可靠、更可解释、更有指导性的大规模语言模型。目前,该公司已筹集了超过一项资金 10 最近有1亿美元的基金,其中包括最近的1亿美元 3 谷歌投资1亿美元。
- AI21labs 为其 Jurassic-1 筹集了文本模型 1.19 亿美元。Jurassic-1 参数超过 1780 亿,规模与 GPT-3 相似。
- Cohere 已成为大规模语言模型(LLM)以及自然语言处理 (NLP) 即服务筹集 1.65 亿美元。
- BLOOM 这个 LLM 该项目获得了私营公司 Hugging Face 以及欧洲研究机构的支持,其目标是建立一个有能力的机构 1760 开源1亿参数 LLM。它接受了 46 人类语言的训练包括 20 种在大多数 LLM 代表性不足的非洲语言。
- 总部位于英国 Stability AI 最近,开源图像生成服务 Stable Diffusion 筹集了高达 1 公司估值超过1亿美元的资金 10 亿美元。
科技巨头意识到了他们模型的局限性。特别是微软最近宣布,企业可以“微调”自己的模型,而不用担心共享自己的专有数据,从而使“为每个人开发更好的模型”成为可能。
然而,这些措施并不能让所有人都满意。德国初创企业 Adelph Alpha 最近筹集 3100 1万美元,它正在通过自己的“欧洲”模型来应对企业对科技巨头基本模型的担忧。然而,目前还不清楚他们是否能与那些科技巨头分手。
科技巨头将赢得横向基础模型的竞争,为少数资本充足的初创公司留下一点空间。也许就像 BLOOM 和 Stable Diffusion 这种开源模型将赢得一些大市场,或者至少找到一个利基市场。根据惯例,一些工具和服务提供商将通过提高这些基本模型的易用性来盈利。但总的来说:
由于从基础云服务中赚取的大部分资金,科技巨头的市场主导地位只会越来越巩固,他们有能力免费赠送基础模型。
3、生成人工智能应用
虽然 GenAI 淘金热的镐和铲子将被科技巨头抢走,但应用层的竞争环境似乎更加公平。由这些基本模型支持的现有企业软件公司、“全栈”初创公司和数千家初创公司将提供新的服务 GenAI 应用。
传统的企业软件公司,如 Salesforce 与微软等,将通过有机或吸收思想 GenAI 给他们带来的功能数十亿用户。微软还将使用它。 GenAI 聊天机器人服务整合到自己身上 Bing 在搜索应用中,谷歌在搜索领域的霸权地位直接受到挑战。
少数资金雄厚的初创企业将提供专门的“全栈”应用。这些公司将在对特殊数据、序列和计算有要求的领域开发自己的基本模型。例如,通过使用应用程序建立自己的模型,GenAI 药物发现和材料科学可以彻底改变。投资者会被这些初创公司所吸引,因为这些公司可以带来丰厚的经济回报,在竞争面前有很强的防御能力。
比方说,Adept AI 已经筹集了 6500 基于开发的万美元 LLM 具有自然语言界面的下一代机器人流程自动化 (RPA)。尚未公开的 Inflection.ai 也在做类似的事情。Character.AI ,一个利用角色声音和知识的聊天机器人已经预约了 10 筹集了1亿美元的估值 2 亿美元至 2.5 专业资金1亿美元,用于专业资金。 LLM 实现全栈,为代表企业应用实时客服提供支持。
GenAI 使用速度会很快。即使是 AI 营销文案的初稿并不完美,编辑起来也很简单。ChatGPT 它是历史上增长最快的消费者 app,推出仅两个多月后,其月活用户就超过了 1 这意味着数量几乎是无限的。 GenAI 创意应用的竞争将非常激烈,瞬息万变。
提供应用程序来解决主要问题 GenAI 主要初创公司的示例
你能想象的每一个用例都会有一个“Copilot”GenAI 应用
将 GenAI 投入使用后,你会看到基于这些基本模型的初创公司在世界各地开发的消费者、企业和组织的应用。许多 GenAI 初创公司将使用“初创公司”Copilot for X“商业模式帮助用户完成“创造性”任务,如写作或编码,以及重复任务,如数据输入或表格填写。以下是一些在各种垂直用例中竞相赚钱的初创公司。
- 专注于一般文本写作的初创企业正在帮助用户实时完成日常写作任务,如写电子邮件、创建文档和填写文本表格。AI21labs 的 Wordtune 像专业作家一样重写你的文字。写作助理之王是 Grammarly,这款 app 已经赚了超过 4 亿美元。写作初创企业名单很长,包括 Lex、HyperWrite、Compose AI 以及 Rytr。
- 专注于销售和营销的初创公司包括筹集资金的初创公司 1.45 亿美元已经成为庞然大物 Jasper.ai。Anyword 融资也超过了 4500 提供“用于实现高销售转化率的文本内容”。面向语言生成 Persado 筹集了超过 6600 一万美元的资金,“在 96% 在这种情况下,生成的文本表现优于你最好的文案。“创业公司越来越专注于特定的任务,比如写产品营销说明。
- 创业企业依靠图像生成 Open AI 的 DALL-E-2、Stability AI 的 Stable Diffusion 以及 Midjourney 支持文本生成图像基本模型。这方面的初创企业可以帮助用户创建拼贴 Art Breeder 等。
- 面部和头像生成的消费者初创公司包括 Lightricks 的 Facetune 应用。这款 app 有助于创造“完美”Instagram 图像。此外,Lightricks 也已融资 3.5 亿美元。很受欢迎 Lensa AI app 用户可以用它来创建个人的“魔法头像”。用户可以用不同的设置替换他们的脸 Reface 已经筹集了 550 一万美元的基金。
- 产品设计初创公司包括包括包括产品设计初创公司 Botika,他们正在“重塑时尚摄影”,可以创造出在各种环境下穿着优质服装的超逼真模特图像。在 Maket 在文本提示的帮助下,生成建筑计划只需几分钟,而不是几个月。” 对于想要翻新的房主来说,Tailorbird 加快了平面图的出图速度。Swapp 则筹集了 700 帮助实现工程施工文件的自动化,需要1万美元。房地产设计 TestFit 已经筹集了 2200 万美元。
- 专注于视频的初创公司提供视频构思、生成、编辑和员工合作的工具。其中 Runway 资金最充裕,他们存入银行的钱也接近 1 亿美元。Magnifi 已经筹集了超过 6000 视频编辑1万美元, InVideo 已经筹集了超过 5300 万美元。包括融资 2600 万美元的 Hour One 其中,有几家初创公司从事文本生成视频服务。总部位于伦敦 Synthesia 是一个头像视频创作平台,目前已融资超过 6700 万美元。总体而言,NFX 追踪到有 54 从事视频生成业务的初创企业共筹集资金 5 1亿美元的基金。
- 音频方面的 GenAI 初创企业包括音乐创作公司 Soundraw、Boomy 与 Aiva。Splash 已经筹集了 2300 一万美元的资金,他们的工具可以让用户创作原创音乐,并根据任何旋律唱歌词。语音服务 DupDub 融资额超过 2.5 而且已有1亿美元 100 万用户。Descript 已经筹集了超过 1 1亿美元的资金可以为音频转录、播客、屏幕录制、音频和视频编辑提供语音克隆。Deepgram 演讲文本服务可以与科技巨头和 OpenAI 的 Whisper 目前,一争高下已经超过 8700 一万美元的基金。
- 游戏生成初创企业有望节省制作工作室 1 生产成本1亿美元。 可帮助创建 2D 到 3D 模型的 Masterpiece Studio 筹集了 600 万美元。 专注于游戏、电影和 meta-verse 开发 AI 配音演员的 Replica 已经筹集了 500 万美元。 游戏工作室 Latitude/AI Dungeon 已经为基于文本的游戏生成筹集资金 400 万美元。VoiceMod 已经筹集了超过 700 在《堡垒之夜》中使用1万美元(Fortnite) 等游戏以及 Skype 等 app 提供实时语音转换。此外,还有创造 3D 初创公司的表面纹理 Ponzu,创建非玩家创建 (NPC) 初创公司的虚拟角色 Charisma AI 等。初创企业 Inworld 方向是“创造沉浸式现实、虚拟角色和虚拟空间” AI 目前已经筹集了开发平台 7000 一万美元的基金。一般而言,A16Z 目前追踪到 50 游戏行业的许多初创公司。
- Chatbot 及对话式 AI 包括融资在内的初创公司 1.9 垂直健康症状检查工具1亿美元 ada,而且已经筹集了 7000 英国初创企业1万美元 Healthily。鉴于人工智能每年可以节省呼叫中心业务 800 初创公司在这一领域疯狂融资1亿美元。Cresta AI 已经筹集了超过 1.5 总部位于伦敦的1亿美元资金 PolyAI 也为其“超人语音助手”筹集了资金 6800 万美元。
- 编码助理初创公司纷纷效仿微软 GitHub Copilot,声称可以自动生成高达 40% 的代码。Warp 它是一家将自然语言转化为计算机命令的公司,已经融资 7000 万美元。Tabnine 已经筹集了 3000 一万美元的基金。
- 融资包括知识管理、摘要和企业搜索初创公司 1.68 亿美元的 Primer AI 以及融资 6300 万美元的 Otter。总部位于斯德哥尔摩的初创公司 Sana Labs 已筹集了 5460 促进组织内信息的发现、共享和再利用,需要1万美元。
那么哪些初创公司会赢呢?
流入到 GenAI 应用初创公司的资金并不短缺。全栈初创公司将在药物发现等垂直领域筹集大量资金,并在这些领域开发高度专业化的模型和应用。在更广泛的 B2B 在这个领域,竞争将渗透到横向和纵向,而商业模式是 copilot 为中心。一方面,横向创业公司将提供跨行业服务,如 Jasper 销售和营销助理。另一方面,初创企业的重点将越来越垂直,专注于某一行业、功能和任务。
获胜者将采取以下措施实现规模化和防御性:
- 高投资回报率-处理的用例非常高 ROI,并且可以在短时间内证明价值。
- 专有定制的基本模型——利用本地化、专业化、专有的公司数据对特定受众进行“微调”。
- 工作流-证明可用性,与客户流程深度集成,一旦安装就难以移除。
- 反馈循环-例如,利用人类反馈的强化学习 (RLFH),从而提高模型与用户意图的一致性。
- 形成飞轮——RLFH 其他反馈越多,通过“微调”获得的模型性能越好,使用量越大,势头越猛。
- 由于投资的规模和速度,投资的规模和速度 IP 掌握在基本模型所有者手中,所以利润率低,游戏完全是规模。那些能够快速建立自己的品牌,吸引大量用户和客户,从而促进飞轮旋转的人将成为该类别的领导者。
在 B2C GenAI 在消费者领域,行动迅速、消费者预算充足的横向玩家很可能会赢得比赛。
总部位于英国 AutogenAI 有能力赢得投标管理助手 B2B 初创企业的例子之一。在过去的两年里,他们开发了一种应用程序,可以帮助企业节省时间和金钱,提高投标、投标和建议的质量。他们使用企业网站的内容、中标和未中标的情况、营销文案和年度报告 OpenAI LLM 进行了“微调”。它们还提供人机监控用户界面,帮助审查内容和事实的来源和准确性。这种做法实现了加强学习循环、提高利用率的关键人类。客户正在逐渐增加应用程序的使用,并将其视为下一代知识管理和搜索工具,从而使其更加粘性。
部分GenAI 初创公司将被收购,成为大型企业和消费者 app 特色功能。例如,拥有数百万用户的大型社交媒体公司将收购最新的面部和头像,创建初创企业。现有的图形设计软件公司将收购最有前途的图像和视频编辑初创公司。例如,行动 CRM 及 ERP 在应用程序的一部分,微软现在提供了本地应用程序 GenAI “Microsoft Dynamics 365 Copilot”。
简而言之,如果一些勇敢而幸运的初创公司能为他们服务 copilot 如果用例快速建立规模和飞轮,他们将获得丰厚的回报。同样,一些全栈初创企业也会在药物发现等专业用例的情况下蓬勃发展。由于融资规模大,市场统一,个人、企业和政府迅速采用创新,美国初创企业将占据主导地位。然而,大多数初创企业将空手而归,因为在这场淘金热中,他们最终只能为镐和铲的供应商(主要是美国科技巨头)的利润做出贡献。
译者:boxi。
本文的部分内容来自网络,仅供参考。如有侵权行为,请联系删除。