ChatGPT启示录系列:万字长文解码全球AI大模型现状

©自象限原创

作者:罗辑

回顾过去几次世界变化的历史,世界将每100年重新交换一次霸权。

只要他成为霸主,他的技术和其他核心优势就会变得普遍,被其他国家和国家掌握,从而被追平。如果霸主想要“继续他的生活”,他需要一场基本的技术革命。英国通过工业革命延续了100年的霸权。

在ChatGPT出现之前,美国基本上已经走到了100年霸主的尽头,他的技术优势已经被更多的国家掌握,甚至在互联网的某些领域,中国也出现了超越的趋势。如果你想继续你的生活,你必须依靠另一场技术革命。以ChatGPT为代表的大型人工智能 2.0时代,很有可能是。

这是新一轮排位赛的开始。面对技术差距,中国大模型一边追赶技术,另一边走着更“脚踏实地”的道路。

因此,我们策划了「ChatGPT启示录录」该系列通过盘点各国大模型的现状,明确定位中国地位,找到中国姿态。本系列分为“ChatGPT全球启示录”、“创业启示录”、“投资启示录”三部分,同时,我们也将高度关注大型模型,并不断更新。

在全球范围内,ChatGPT掀起了人工智能模型的浪潮。

在美国,OpenAI、Anthropic等初创企业和以微软和谷歌为代表的科技巨头,带领美国在人工智能大模型的道路上疯狂奔跑,最大参数已达5620亿。在中国,许多已经成功的科技巨头,如美团王慧文、阿里贾扬清、前搜狗首席执行官王小川、前京东人工智能领袖周伯文等,再次被披露。

一时间,人工智能大模型就像火煮油。

但在这一轮浪潮中, 我们主要关注的是中美两国的进步。此外,世界其他国家和地区如何看待人工智能模型,如何发展大模型,不同国家和地区的人工智能模型发展具有什么特点?这些问题实际上是在中美光环下失焦的。

在这样的背景下,所谓的其山之石可以攻玉,「自象限」梳理了中国、美国、韩国、日本、欧洲等主要国家人工智能大模型的发展现状。

我们发现,一方面,不同国家人工智能模型的发展与国家互联网的发展密切相关;另一方面,芯片、云计算、高质量数据、模型框架和算法经验、用户群体和社会文化共同决定了国家人工智能模型的发展高度。

就如同比尔・盖茨将ChatGPT的发布与互联网的发明相比,并认为它可以改变世界。英伟达首席执行官黄仁勋在GTC2023年也三次提到“人工智能迎来iPhone时刻”。人工智能模型是世界各地的机会,中国企业家不应该有盲点。

如果你远离你的视野,你会发现所有国家的大型模型都继承了自己的“基因”。互联网和技术在过去20年中积累的成果也在人工智能中 2.0大考下,瞬间爆发。有的人交满分答卷,有的人名落孙山。

美国:多么强大,多么孤独

美国在人工智能大模型方面的实力不是现在的实力,而是一直的实力。

从2012年AI萌芽到2016年AI1.0,再到2022年ChatGPT带来的AI2.0,美国一直是AI领域的破局者,引领全球AI发展。

例如,谷歌于2017年提出了几乎所有人工智能大模型训练中使用的Transformer网络结构。它具有优异的长序列处理能力、更高的平行计算效率、无需手动设计和更强的语义表达能力。Transformer的提议使大模型训练成为可能。

计算能力是确保美国大型人工智能模型出现的另一个关键,而美国拥有全球计算能力的核心资源。

云计算不仅可以为人工智能大模型培训提供计算、存储、网络和应用平台,还可以提供人工智能工具和服务,如数据处理、模型部署和推理。让企业在不花费大量时间和金钱的情况下快速培训大模型,建立和维护自己的数据中心。

目前,美国拥有世界上最大的云计算企业。IDC数据显示,包括亚马逊、微软、谷歌、IBM在内的美国企业占2021年全球IaaS市场的近70%。而美国最具代表性的AI大模型初创企业,无论是OpenAI还是Anthropic,都接受了微软、谷歌等云大厂的投资。除了资金支持,更重要的原因是背后的云计算资源。

计算能力的另一个维度是芯片,它能提供更高效的计算能力,从而加快训练过程。

速度有多快?2016年,黄仁勋亲自将世界上第一个DGX-1(英伟达计算平台)捐赠给OpenAI,DGX-1是3000人开发的第一个轻量化小型超算,需要3年时间。计算和吞吐能力相当于 250台传统服务器。有了DGX-1,OpenAI前一年的计算量只需一个月就能完成。

到目前为止,英伟达的A100芯片仍然是唯一能够在云中实际执行任务的GPU芯片。在最近的GTC2023上,黄仁勋更新了新芯片H100的进度。H100配备了Transformer引擎,可用于处理类似ChatGPT的人工智能模型,其服务器效率是A100的十倍。

可以说,在人工智能大模型领域,目前的美国是正确的“别人的孩子”,这也导致了该行业最具代表性的人工智能大模型集中在美国。

比如OpenAI最新发布的多模态预训练大模型GPT-4,谷歌最新推出了“通才”大模型Palm-E,拥有世界上最大的5620亿参数,能看图说话,能操控机器人,还有刚刚解决AI绘画手指问题的Midjourney等等。

然而,在快速发展的过程中,美国行业对人工智能大模型也持激进和保守的态度。

其中,微软支持的OpenAI在推动大模型落地时更加激进。根据OpenAI关于GPT-4的安全文件,OpenAI在发布GPT-4之前聘请了安全专家进行测试。

OpenAI在文档中写道:“GPT-4表现出一些特别令人担忧的能力,如制定和实施长期计划的能力,积累权力和资源(寻求权力),以及越来越多的“代理”行为。因此,一些安全专家建议 GPT-4 推迟部署时间 6 到今年秋天,OpenAI已经发布了一个月,但是OpenAI并没有采纳这个建议。

另一方面,在ChatGPT发布后,谷歌表示,其人工智能模型具有相似的能力,但由于安全考虑,它没有及时进入市场。包括OpenAI创始人Sam Altman和马斯克多次公开表达对AI大模型和人工智能的担忧,并表示应更加谨慎地对待大模型的市场化。

目前,谷歌投资的另一家AI创业公司Anthropic,可以与OpenAI进行标杆,实际上是因为这个想法不同,从OpenAI中走出来,自立门户。

当然,在激烈的市场竞争下,即使是相对谨慎的谷歌也似乎忘记了这种担忧,并在3月7日报复了5620亿参数模型,甚至控制了机器人运动。

目前,以微软和OpenAI为代表的美国人工智能大模型正在积极推广工业应用。早在2月份,微软就宣布将在全线产品中访问ChatGPT,并以几乎每周一次的速度更新一次。

从New 加入最新功能Copilot的BingMicrosoft Teams正在搅动全球产业变革。

日本:错过互联网、云、人工智能

如果说美国是最强大的大型“老炮”,那么日本可能会成为这个排名的“起重机尾”。

事实上,日本的落后应该从上一个互联网时代开始。当我们盘点世界人工智能大模型领域的关键角色时,我们会发现中国的BAT、韩国的Naver、美国的谷歌和亚马逊都是互联网时代的巨头。

一方面,这些企业通过互联网业务积累了大量的高质量数据;另一方面,他们在自己的业务推广下建立了完整的云计算系统。但经过库存,我们发现日本既没有互联网巨头,也没有云计算制造商。

目前,日本的即时通信软件来自韩国的LINE,云计算业务也长期受到美国企业的控制。

2022年,日本云计算市场份额约占全球4%,排名第四。然而,日本云计算市场的主要竞争对手是亚马逊、微软和谷歌,它们在日本的市场份额已经达到60%~70%。

此外,日本实际上还面临着许多其他问题,如由于半导体行业的衰落,日本应该成为人工智能芯片领域的最大优势;例如,作为一个小型语言国家,日语和中文一样缺乏语料

在这种情况下,日本在人工智能时代早已失去了自主权。所以我们盘点日本AI大模型会发现大部分都有美国或韩国的颜色。

例如,日本最早公开推出的NLP模型是2020年发布的NTELLILINK Back Office NLP,当时可以实现文档分类、知识阅读理解、自动总结等功能。但是NTELLILILINK。 Back Office是在谷歌BERT的基础上开发的应用,就像中国很多基于GPT-3开发的应用一样。

日本血统的生成AI实际上是HyperCLOVA、Rinna 和 ELYZA Pencil,HyperCLOVA 和 Rinna 还有外国基因。

其中,HyperCLOVA最早于2021年由韩国搜索巨头NAVER推出,其日本版由NAVER及其子公司LINE开发。然而,HyperCLOVA确实是第一个专门针对日语的大型语言模型。它通过爬行日本博客服务获取训练数据,并在2021年举行的对话系统现场比赛中在所有赛道上获得第一名。

LINE还推出了许多基于HyperCLOVA的应用,如聊天机器人CLOVA Chatbot、CLOVA图像识别 CLOVA Speech等。HyperCLOVA参数820亿,目前计划通过100多亿页的日文数据作为学习数据,将模型规模扩大到1750亿。

图源日本版HyperCLOV官网

日本的另一个大型人工智能模型Rinna与微软有关。Rinna是微软和日本开发的第一个聊天机器人,类似于国内的小冰(以前被称为微软小冰,已经独立运营)。

2021年8月,Rina发布了一款名为GPT2-medium的模型,随后在次年推出了日本版GPT-2,参数达到13亿。日本版GPT-2和GPT-2的区别在于,GPT-2采用英语语料,日语版GPT-2以日语语料训练为基础。

图源日本Rinna官网

目前,日本版的RinnaGPT-2和HyperCLOVA已经是日本参数最大、最具代表性的大型模型。

当然,日本也有一些真正的土生土长的大模型,比如东京大学松尾研究所的AI创业公司,2022年3月 ELYZA Co., Ltd.以产品“推出大语言模型”ELYZA Pencil以市场为导向。输入几个关键字,ELYZA Pencil可以在大约 6 在几秒钟内创建三种日本新闻报道、电子邮件或简历。

ELYZA图源 Pencil官网

所以算起来,ELYZA Pencil是日本首次公开发布的生成人工智能产品,但只有ELYZA Pencil显然很难成为全村的希望。

事实上,日本政府也在努力扭转这种局面。例如,2022年5月,日本政府计划将云计算服务列为涉及国家安全的“特定重要材料”,并将加强日本的“国内云”,但实施效果不大。

毕竟,互联网和云计算都是规模经济,需要足够的市场容量来产生经济效益。这也导致了日本互联网和云计算在全球市场和当地市场都缺乏足够的增长空间。

但即便如此,日本市场也在积极研究大模型的应用。

例如,2022年5月,东京大学和 Google Brain 一个研究小组发表了论文《Large Language Models are Zero-Shot Reasoners》,解决了大模型0样本学习的一些问题。

在日本的互联网上,日本网民也在积极调用GPT-3API,试图开发自己独特的应用程序。此外,英伟达GTC刚刚举行 2023年,英伟达与日本三菱联合打造了日本第一台生成式AI超级计算机,用于加速药物研究。

韩国:只有财阀巨头,没有初创公司

没想到,一直被日本看不起的韩国,在大模型领域跑得比日本快。

事实上,韩国是第一个加入人工智能大模型研发的国家之一,但韩国人工智能大模型的经济是一样的,只有财阀,没有初创公司的故事。目前,韩国只代表互联网巨头Naver和Kakao,移动运营商巨头KT和SKT,以及通信巨头LG。

除了财阀的主角,跟上美国的步伐也是他们的一个重要特征。

例如,在GPT-3的应用中,OpenAI在2020年发表了GPT-3的论文,韩国公司在2021年推出了相应的产品,反应速度比中国快。人工智能也是如此。当谷歌、亚马逊和其他美国巨头在2020年推出人工智能加速芯片时,SKT同时推出了自主开发的人工智能加速芯片SAPEON X220。

在芯片半导体方面,韩国的积累也扩大了其在人工智能大模型方面的优势。目前,韩国企业正在积极与半导体企业结盟,以应对大模型发展带来的计算挑战。

例如,2022年底,Naver开始与三星电子合作开发下一代人工智能芯片解决方案。该解决方案基于Naver推出的人工智能大型Hyperclova进行优化。目前,开发已进入最后阶段。

同年,KT还为芯片设计公司提供服务 Rebellions Inc.这是一家位于韩国的人工智能初创公司,拥有独特的特殊芯片技术。Rebellions将优化KT公司的MI:DEUM,并促进其商业化。

此外,KT还投资了人工智能初创公司Moreh,并计划今年推出一套韩国半导体,其效率可能是目前半导体的三倍多。KT希望通过这种方式进入英伟达主导的人工智能半导体市场。

第三点,韩国对人工智能大模型的垂直应用进行了更多的探索。比如KoGPT在医疗保健中的应用,Exaone在生物医学和智能制造中的应用等等。

总的来说,韩国的人工智能模型在基础设施方面非常完善,如三星电子、SKT等半导体巨头;互联网有Naver和Kakao等基准企业,这些特点使韩国能够在人工智能模型的发展浪潮中走在世界前列,并推出了一系列具有代表性的人工智能模型。

比如前面提到的,韩国最大的搜索公司Naver于2021年推出了HyperCLOVA,韩国版 HyperCLOVA 参数2040亿,比GPT-3多290亿,其中97%使用韩语语料。

目前,Naver计划在今年上半年基于HyperCLOVA推出Search GPT(类似微软New Bing)7月份推出HyperCLOVA X,这是HyperCLOVA 最新版本。

图源韩国版HyperCLOVA架构

同样在2021年,另一家韩国互联网巨头Kakao AI研究部Kakaoo 在Kakaoo之后,Brain发布了基于GPT-3的KoGPT Brain将KoGPT更新为GPT-3.5 ChatGPT采用相同版本的预训练大模型。Kakao Brain 首席技术官 Kim Kwang-seob “基于开发,KoGPT将专注于开发 AI 图像创建技术和医疗保健技术。”

Kakao 除了KoGPT,Brain还推出了基于人工智能的图像生成器 Karlo,BEDIT和BDiscover,类似stable diffusion。

KoGPT研发团队图源 图源Kakao Brain官网

2022年5月,SKT推出了基于GPT-3的聊天机器人A.测试版,用于处理客户的具体任务。目前,A.已在韩国获得100万用户,并计划在今年推出正式版本。

2022年12月,LG集团人工智能智库LG AI Research Exaone已经推出。这是一个多模态模型,参数3000亿,使用图像和文本数据,也是韩国最大的参数模型。Exaone应用于生物医学和智能制造,有助于加快抗癌疫苗和创新电池的发展。

Exaone在电池工业和生物医学中的应用

据韩国介绍,今年1月据《经济日报》报道,韩国KT还将在上半年推出自己的ChatGPT产品。此前,KT于2022年11月推出了基于GPT-3的人工智能服务MI:DEUM,它可以实时回答问题,总结报纸和文章,并提出投资建议。KT公司也在积极向韩国金融服务公司推广MI:DEUM。

韩国KT公司logo图源 图源网络

然而,韩国也面临着许多挑战,比如韩语在语料方面面面临着复杂的语言体系和语料不足,就像中文和日语一样。

HyperCLOVA的工程师提到:“韩语是一种凝聚力语言。名词背后有例子,动词和形容词的词干背后有尾音,表达了各种语法性质。使用类似英语的韩语标记已被证明会降低韩语模型的性能。”

此外,韩国工业界认为,韩国严格的数据使用规定阻碍了韩国初创企业收集足够大的数据来训练人工智能模型。

韩国是世界上数据信息管理最严格的国家之一。尽管韩国在2020年通过了三项数据隐私法的修订,以放宽对个人信息使用的规定,但该国对数据使用的规定仍然比其他国家更严格。

2021年初,韩国人工智能初创公司Scater 基于Faceboook的Lab上线 人工智能聊天机器人“李LUDA”Messenger,但仅仅20天后,“李LUDA”就不得不终止服务,Scatter Lab甚至公开道歉。

原因是“李LUDA”上线后,一些韩国男性用户将其视为性对象甚至“性奴隶”,肆意发泄恶意。他们用各种语言侮辱“李LUDA”,并将其作为炫耀的资本,在网上引发了“如何让LUDA堕落”的粗俗讨论。

受这些信息的影响,“李LUDA”很快开始发表各种歧视性言论,包括女性、同性恋、残疾人和不同种族的人。“李LUDA”的问题也涉及到韩国的个人信息保护,有关部门介入调查。

就像韩国电影一样,“李LUDA”的案例为世界人工智能大模型的发展提供了更多的伦理和道德启示。很多人害怕人工智能的恶意,但人工智能实际上没有善恶之分。所谓的善恶实际上来自人类本身,这取决于你给人工智能什么样的数据,就像我们教孩子什么样的知识一样。

除此之外,韩国人工智能大模型领域缺乏初创公司,韩国对初创公司的投资也相对匮乏。

根据斯坦福大学HAI发布的情况 AI Index 2022年,韩国初创公司投资11亿美元,仅占美国初创公司投资529亿美元的2%,甚至低于以色列的24亿美元。这也导致韩国在人工智能初创公司独角兽方面落后于其他国家。

根据全球科技市场跟踪机构 CB Insights 数据,截止日期 2022 年 12 月,美国的 AI 独角兽数量最多,有 53 一家初创公司。中国 19 第二,英国有四家,但韩国没有人工智能独角兽公司,即使是国内生产总值 (GDP) 也有以色列低于韩国的以色列 3 家。

CB的图源数据源 Insights

一家公司专注于互动 AI Genesisis,韩国机器学习技术的企业 Lab Inc. 创始人兼CEO Lee Young-bok 韩国公司普遍对人工智能不友好,并补充说,政府或公共组织应该更积极地使用人工智能技术。

欧洲:只有德国认真“搞事业”

欧洲似乎仅次于美国,但在人工智能中 在大模型方面,欧洲并不比日本好,甚至处于不断腐烂的状态。

Future of Life Institute (FLI)一份报告在2022年11月发表:欧洲没有开发通用人工智能系统,也不太可能很快开始这样做。”

FLI是美国一家致力于降低全球灾难性和生存风险的非营利性机构。先进人工智能带来的风险是其最重要的研究方向之一,其创始人包括DepMind研究科学家 Viktoriya Krakovna,马斯克还担任该机构的顾问,并提供资金。

FLI认为,在人工智能大模型中,欧洲可能主要扮演用户的角色,即通过访问其他国家开发的大模型API来开发应用程序。

例如,芬兰的Flowrite,一个基于人工智能的写作工具,可以生成电子邮件、信息和其他内容。例如,荷兰的MessageBird,一个全渠道通信平台,都是在GPT-3的基础上运行的。

欧洲在人工智能大模型方面确实缺乏有影响力的企业。总部位于英国的唯一DeepMind仍然是由 Alphabet 全资拥有。德国是整个欧洲唯一一个担心因为大模型落后而被世界抛弃的国家,也是唯一一个为此心碎的国家。

例如,谷歌3月7日推出的最新多模态大模型Palm-E,PaLM-E由谷歌和柏林工业大学共同创建,目前参数5620亿,是世界上最大的视觉语言模型。

除了合作研发,德国还拥有欧洲唯一的人工智能模型。

2022年4月,位于海德堡的德国初创公司Aleph Alpha发布了一款参数700亿的预训练模型Luminous,约为GPT-3的一半。Aleph 在此基础上,Alpha训练了聊天机器人Lumi,并计划在今年晚些时候发布最新版本的Luminous-World,其参数规模将达到3000亿。

Luminous作为一家欧洲企业,最大的特点是更保护安全和隐私,Aleph Alpha 说明他们“不记录任何用户数据”。大多数人工智能模型,包括OpenAI,需要用户数据训练(数据收集过程是透明的)。

图源Luminous官网

德国除了建造大型模型外,还为欧洲薄弱的人工智能基础设施伤透了心。

德国人工智能协会正在开展大型欧洲人工智能模型(LEAM) 获得博世、博世、SAP、大陆、拜耳、默克和其他德国工业巨头以及欧洲类似的人工智能协会的支持。LEAM计划从数据收集、人才培训、基础设施建设等方面投资3.5亿欧元,为欧洲人工智能模型的发展建立竞争力 AI 生态系统。

当然,你可以抱怨欧洲在技术和商业上的胯部,但你不能抱怨它在公共事业上的努力。

2020年8月,欧洲还发布了一款名为BLOOM的大型模型。这是由 AI 初创公司 Hugging Face 在法国政府的资助下发起的全球项目 1000 许多志愿者研究人员花了一年多的时间创建它们 AI 该模型旨在消除传统大语言模型的保密性和排他性,并从一开始就嵌入伦理考虑。

BLOOM有 1760 这是第一次使用西班牙语、阿拉伯语和其他语言训练。BLOOM最大的特点是可访问性,任何人都可以从 Hugging Face 免费下载网站进行研究。

BLOOM的研究人员认为,开发与其他高级模型相同的大语言模型将给人工智能开发文化带来长期的变化。因此,从欧洲的角度来看,这是一项致力于人工智能民主化的重要工作。

从 从BLOOM的角度可以看出,欧洲对人工智能大模型的关注不同于世界其他国家。SDG的开源包容性和绿色安全一直是欧洲关注的焦点。因此,在AI大模型之后,欧洲实际上在立法上花费了大量的精力。

例如,最重要的立法是《人工智能法案》,即将在3月底提交欧盟议会表决。

该法案于2021年由欧盟委员会提出,因为欧盟认为,从跨国的角度来看,各国的独立监管措施将导致监管碎片化,从而阻碍跨境人工智能市场的形成,威胁到数字主权。同时,他们也担心复杂的监管会抑制创新,威胁个人隐私,甚至人工智能失控带来的一些潜在风险。当然,最重要的是,欧盟希望通过立法参与制定全球人工智能标准。

具体来说,欧盟希望根据风险水平对不同的人工智能技术进行分类,具体如下:最小、有限、高、不可接受。高风险技术不会被禁止,但相关公司将被要求在运营中保持高度透明度。所谓透明度的规则是迫使相应的公司澄清其人工智能模型的内部运作模式。

一旦该法案通过,它将成为欧盟成员在中国直接适用的法律。如果企业想在欧盟销售或使用人工智能产品,必须遵守相应的法律法规,否则将面临高达其全球年营业额的法律法规 6% 的罚款。

但FLI认为,欧洲对其他国家的技术依赖可能会阻碍欧盟努力制定全球人工智能标准。

欧洲的问题是缺乏统一的大市场。

就GDP总量而言,2022年欧盟GDP16.65万亿美元相当于中国;2022年欧盟人口4.46亿,甚至超过美国3.32亿。然而,欧盟有28个国家,23种官方语言,加上与美国的深度绑定,导致欧盟在互联网时代没有创建大型互联网企业,然后继续打开与人工智能模型相关的基础设施,如数据量、云计算和推理培训。

如今,在人工智能大模型领域,欧洲很难组织强有力的阻击,但对中国企业来说,欧洲仍然是一个广阔的市场。

中国:最活跃的人工智能市场,爱打组合拳

很多人可能会认为,中国的AI大模型始于“文心一言”。但“文心一言”其实只是ChatGPT的产品,百度、阿里、腾讯、华为都有其背后的AI大模型布局。

但有趣的是,中国第一个AI大模型并不是来自这些大企业,而是来自智源研究院于2021年3月发布的“悟道1.0”。

有些人可能会想知道智源研究所是什么角色,所以我告诉你,它是一支合适的国家队。

依托北京大学、清华大学、中国科学院、百度、小米、旷视科技等北京人工智能优势企业共同建立的研究机构,智源研究院得到科技部和北京的支持。

悟道1.0不是一个大模型的名字,而是一系列大模型的总称。

具体包括中国第一个中文预训练语言模型悟道·文源;第一个公开的中文通用图形多模态预训练模型悟道·文兰,第一个具有认知能力的超大规模预训练模型悟道·文汇和超大规模蛋白质序列预测预训练模型悟道·文本追溯。

除了发布了许多名为“第一”的大模型外,智源研究所还为中国建立了大规模的预培训模型技术体系,建立了世界上最大的中文语料数据库WuDaoCorpora,为其他企业后来开发人工智能模型奠定了基础。

也许受“悟道1.0”的影响,几乎所有的企业在发布大模型时都不止一个,而是一串。

例如,百度于2019年发布了文心大模型。和悟道AI一样,文心大模型也是包括NLP在内的众多模型的总称、CV(机器学习)、跨模态大模型和生命计算大模型四类36个大模型。

3月16日,基于文心大模型,百度发布文心一言,成为中国首款ChatGPT产品。

百度文心大模型官网图源

2021年,华为以升腾为基础 AI 鹏程盘古大模型与鹏城实验室联合发布。盘古大模型包括CV和NLP。其中,盘古NLP大模型是业内首款100亿中文NLP大模型。

2022年9月,阿里发布了包括NLP大模型AlicMind在内的“通义”大模型系列、CV视觉大模型,M6多模态大模型。M6大模型是中国第一个参数1000亿的多模态大模型。

目前,阿里巴巴“通义”大模型系列在200多个场景中提供服务,提高了2%-10%的应用效果。典型的使用场景包括电子商务跨模态搜索、人工智能辅助设计、开放领域人机对话、法律文件学习、医学文本理解等。

阿里官网图源

同样在2022年,腾讯发布了包括NLP在内的混元AI大模型、CV、多模态等基础模型以及众多行业/领域模型。截至今年2月初,腾讯混元AI大模型团队推出万亿中文NLP预训练模型Hunyuan-NLP-1.目前,Hunyuann-NLP-腾讯广告、搜索、对话等内部产品已落地1T大模型,并通过腾讯云为外部客户服务。

到今年2月底,腾讯也开始开发ChatGPT产品,并成立了“混合助手”(HunyuanAide)”项目组。

3月14日,尚唐发布了多模式通用大模型“学者2.5”,参数30亿。其跨模式开放任务的处理能力可以为自动驾驶、机器人和其他通用场景任务提供感知和理解支持。”学者(INTERN)2021年11月,商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学首次联合发布。

此外,京东还于2月10日宣布研发工业版ChatGP—ChatJD,网易、360、人工智能大模型的布局也宣布了字节跳动等。

可以说,目前国内有头有脸的互联网企业基本都有AI大模型,或者制定了相应的计划。

与大多数外国企业专注于大型模型不同,中国企业不喜欢在大型模型中独自战斗,而是喜欢通过一系列的组合拳击。

另一个特点是,除了在实验室中与国外大型模型进行抛光和成熟外,中国的大型模型都来自工业终端。例如,阿里巴巴、百度和腾讯的大型模型将应用于广告推送、社交平台图片识别、内容分发等领域。

因此,当中国企业推出大型模型时,消费者用户的感知并不强烈,但当你体验到广告推送越来越准确时,视频平台和电子商务平台猜测你喜欢越来越能得到你的观点,背后有大型模型的信用。

与韩国缺乏创业精神不同,人工智能大模型正在推动中国人工智能大模型领域的创业趋势。

过去,美团联合创始人王慧文在朋友圈公开组队。阿里巴巴VP贾扬清、创新车间首席执行官李开复、前搜狗首席执行官王小川、前京东人工智能负责人周伯文、出去询问创始人李志飞等人纷纷创业。「自象限」据不完全统计,目前已有10位大佬下场。

关于中国ChatGPT的创业机会,「自象限」下一篇题为《中国ChatGPT创业启示录(上)》的《ChatGPT启示录》将具体提及,欢迎关注。

除了创业,中国投资机构也跃跃欲试。

王慧文确认人工智能大模型结束后,一张真正的基金合作伙伴戴雨森、刘元、王慧文、李志飞在网上疯传,被认为是人工智能大模型时代的标志性照片。目前,王慧文已确认新一轮融资超过2.3亿美元,可能包括真正的资本和源资本。

图源36氪,戴雨森、王慧文、李志飞、刘元(从左到右)

此外,在2022年11月举行的2022年秋季路演中,陆奇选择了55个项目,其中16个项目与大模型有关。

可以说,人工智能大模型正成为中国硬科技投资的新趋势。关于中国ChatGPT的投资现状,「自象限」专题《ChatGPT启示录》第四篇《中国ChatGPT投资启示录》将具体提及,欢迎关注。

总的来说,中国几乎是世界上最活跃的市场,从投资、创业到应用。

所以我们不用担心为什么ChatGPT没有发生在中国,因为未来还有很大的前景。

参考资料:

https://www.intellilink.co.jp/column/ai/2022/070800.aspx

https://bigscience.huggingface.co/blog/bloom

https://futureoflife.org/wpcontent/uploads/2022/11/Emerging_NonEuropean_Monopolies_in_the_Global_AI_Market.pdf

http://m.ce.cn/gs/gd/202303/15/t20230315_38444222.shtml

本文的部分内容来自网络,仅供参考。如有侵权行为,请联系删除。

相关推荐
ChatGPT国内能用吗?ChatGPT国内注册方法
2023-06-28

ChatGPT国内能用吗?ChatGPT国内注册方法

Chat GPT被定义为一种生成语言模型,它被理解为经过训练和设计以进行自然对话的人工智能聊天。最近ChatGPT在国际上很火爆,很多投资者就想知道ChatGP...