【ChatGPT专题】国内10家大厂争做ChatGPT,逐鹿群雄,谁能笑到最后?
2023-02-17
来源:腾讯网
近期,360创始人周鸿祎对互联网圈进行了评论:在ChatGPT领域,美国超过了我们,中国公司和科研人员需要加速追赶。
ChatGPT的兴起引起了国内外互联网公司的关注。为了应对ChatGPT的挑战,谷歌在2月8日紧急推出了人工智能聊天机器人Bard。国内的百度宣布将于3月初推出“文心一言”,其他互联网公司也纷纷效仿。
截至2月10日,已经宣布拥有类似ChatGPT技术储备、准备发布和已经发布类ChatGPT产品服务的国内大厂包括:阿里巴巴、腾讯、华为、字节跳动、京东、360、科大讯飞、快手、网易有道等,超过10家互联网巨头纷纷进入了热门的ChatGPT领域。
小型科技公司正在跟风热度,大型公司也并非轻松控制ChatGPT。比如谷歌Bard发布时,演示视频中犯了一个事实错误,导致谷歌股价大跌,目前市值已经下降了1700亿美元。
1.扎堆入局ChatGPT竞赛
在搜索和AI领域积累最深的百度,自然被市场寄予厚望。
百度,作为在搜索和AI领域积累最深的公司,在市场上拥有很高的期望。计划在今年三月推出一款类似于ChatGPT的人工智能聊天机器人服务,名为“文心一言”,英文名为ERNIE Bot。在内测完成后,将向公众开放。不同的是,该工具将初始版本内嵌入搜索服务中,允许用户通过对话式方式获得搜索结果。
百度的CEO李彦宏在去年9月判断人工智能的发展将有“技术层面和商业应用层面的方向性改变”。尽管没有首先推出ChatGPT,但百度具备了人工智能所需的算力、算法和数据,在芯片、框架、模型和应用四个技术方面都有布局,是国内少数拥有全栈AI能力的公司。
相比百度的技术研发储备,阿里和字节跳动可能是另外两个较早布局的玩家。
2月9日,阿里的达摩院版ChatGPT在内测中预先曝光。该新产品具备多种功能,包括知识问答、人工智能绘画、代码生成、小说续写、文案撰写和写诗作词等。在人工问答的水平方面,达摩院版ChatGPT已经实现了相对真实的回答,同时也能实现多轮问答。
实际上,在2022年5月,阿里公布了相应的能力,在AIGC方面,随着超大规模多模态预训练模型M6的发布,生成的实景图片已经非常逼真。
阿里现已推出了M6芯片,支持十万亿的模型参数规模,平均单卡可承载200亿参数,同等参数规模能耗仅为前业界标杆的1%,大大降低了大模型训练的门槛。
字节动态正在研发ChatGPT,虽然全栈技术不是非常出色,但在商业应用方面有很大的前瞻性。字节动态从去年开始研发类ChatGPT项目,现在已经在内部上线了测试插件,由AI实验室主导,还在探索当中。此外,字节动态的AML团队也开发了veGiantModel模型,类似于为ChatGPT提供支持的GPT-3.5系列模型。
字节动态早就着手研究基于GPT2和GPT3的训练模型和产品,在NLP领域也有许多研究积累。目前,字节动态在对话机器人、机器翻译、机器写作方面有多项研究,特别是内容创作方面。在ChatGPT用于写文章之前,字节动态就研发了Xiaomingbot自动写稿平台,从2016年上线以来,已经写了60万篇文章,覆盖了17场体育赛事,支持6种语言。
近日,快手也宣布正在大力研究大型语言模型(LLM),并已经启动了相关项目,涵盖了LLM模型的训练、文字自动创作和生成、对话系统的开发等领域。
另外,京东云的言犀也宣布将推出工业版的ChatGPT:ChatJD,其参数量预计为千亿级别,主要应用于零售和金融两个领域。
2.国内大厂为何没能抢得先机?
近几年,大量的大公司和研究机构加入了人工智能领域,但真正有实力的玩家并不多。估测训练1750亿参数的GPT-3语言模型需要上万个CPU/GPU,持续输入数据24小时,而且一次运算就需要450万美元,能耗相当于开车往返地球和月球。因此,主流的大型语言模型只能被大型科技公司和少数研究机构掌握。
从参数数量上看,国内百度的文心模型有2600亿参数,高于GPT-3的1700亿参数,但参数数量不能代表模型的效果。国内公司如百度和字节跳动拥有大量数据积累,但数据清洗、标注、模型设计、训练和推理等需要时间积累,这可能是国内模型效果不如国外的重要原因。
关键时间点是2020年年中,GPT3.0刚刚推出。据流传的专家纪要,很多人认为GPT3.0不仅代表了技术,也是人工智能模型发展的新理念,因为开发商OpenAI对此具有独到的见解,领先于国外的Google,国内公司比OpenAI晚了两年。
许多科技企业认为,ChatGPT并不是一种革命性的技术。它是OpenAI对GPT-3模型进行微调后开发出的对话机器人,并未实现底层模型的重大突破,只是通过理解、生成和交些相结合的方式,基于人类反馈进行强化训练,从而带给人们智能的体验感。
Meta首席人工智能科学家Yann LeCun也曾表达过对ChatGPT的看法,他认为它并没有什么特别的创新,许多研究实验室都在使用同样的技术。
很多互联网企业没有意识到ChatGPT对现有搜索模式的颠覆,也没有准确预测到ChatGPT对脑力劳动者产生替代的关系。他们认为“聊天”只是一种浅层的应用,仅仅是一个更强的聊天机器人,现阶段并不能看到其商业的潜力。
同样的观点还包括字节的NPL算法工程师,他认为ChatGPT是一个不确定性极高的项目,国内尚未有成功的先例。如果决定全力以赴,很难获得资源支持,更别说提高优先级了。因为国内的技术能力有限,缺少人力、资金和基础模型,对于互联网大厂这种商业公司而言,有着较大的难度。
造成的结果表现在不仅认知层面存在局限,在技术上也有所局限。ChatGPT 的信息截至 2021 年,这意味着它无法提供实时信息。现在,百度正在努力解决信息实时性问题。与此同时,ChatGPT 已经在准备推出基于 GPT-4 的新产品,国内企业也有了新的目标需要实现。
3.跟风热潮中,谁在硬蹭热点?
前阿里云大模型负责人杨红霞评论了目前互联网公司热衷于做ChatGPT的现状。她表示:“仅有参数规模达到100B以上的大模型才有足够的实力来提供高质量的对话回答。”
根据这个标准,百度的飞桨平台和文心大模型、阿里的“通义”大模型以及华为的鹏城盘古大模型都有较高的实力。而360、网易有道以及学而思等企业目前技术研发水平和进度较差,缺乏相应的大模型和技术储备。
此外,还有一些企业被认为是跟随潮流追风口,比如汉王科技。根据半年报,该公司相关的文本大数据业务营收仅占总营收的14%,同比还有下降趋势。然而,该公司却通过炒作ChatGPT概念实现了股价的暴涨。
近期,越来越多的企业都在积极使用ChatGPT技术来提升自身业务。然而,也有一些企业并没有采取任何行动,但却受益于ChatGPT热潮。2月8日,微软推出了集成了ChatGPT技术的新版必应,其回答内容中不少答案来自知乎,该天下午知乎的股价一度涨幅超过56%。由于ChatGPT可能对社区问答造成深远影响,知乎方面一直对ChatGPT相关事宜保持沉默。但市场对其仍然热爱,带动了股价的增长。
有业内人士表示,许多中小型企业缺乏技术实力,但也可以利用开源的Transformer大模型,在一定程度上实现ChatGPT的功能。
然而,达摩院专家表示,目前大规模预训练的基于Transformer的模型虽然能很好地解决感知智能相关任务,但由于缺乏精心设计的纯Transformer模型,基本无法实现认知智能。
正如字节跳动的情况,火山引擎的售前支持人员也表示,该平台尚未推出类似产品,但可以通过机器学习平台与自家产品结合,经过二次开发,能够实现类ChatGPT的效果。
4.尾声
AIGC尤其是目前的ChatGPT确实是非常重要的新方向,不像之前谈元宇宙很多人不认可、谈28nm落地很多人摇头、谈国产操作系统大家尴尬一笑,经过这段时间发酵,和AI相关的上下游企业都是非常紧张而且重视的态度。
AI产业的成熟,是大家目前极少数能看清的,可以提升整个社会生产效率的可落地工具,也就是很多年不再提升的全要素生产率,能再上一个台阶的最大希望(很多人原本期待L4自动驾驶会先落地),经济增长越慢大家才越内卷,AI有可能会让经济增速上一个台阶。这个方向是几乎不可能被放弃的,对于互联网头部企业而言,如果这一次的机遇无法把握住,那么像新巨头字节之前用算法(当时的最新工具)颠覆老巨头百度这种事情也会有很大概率再次上演,这也是各家非常紧张的真实原因。
但是实际来看,也能理解这里算法、算力、数据三个方面的要求都是极高的,所以严格意义上只有巨头能做。从事实出发,我们不能发现,现在连足够算力的先进制程AI芯片都不够,目前大家能想到的妥协方案是用CPU来顶。所以小公司撑不起全谱系AI研发,大概率仍旧是接入端口部署应用,包括最后国内能活下来的AI平台,可能也就是两至三家;
如果类比AI产业对于,就如8年前伊始的新能源汽车,有两三年的技术代差,但是核心技术没有实质性垄断、没有专利权铁桶、没有制造业上的硬门槛,目前对于国内最尴尬的是算力芯片的困局,但是在其他领域(数据源、人工标注、中文语境)是有比较优势的,有点像当年新能源车里我们有(国内市场、人工、电池、补贴)这些优势一样。希望是靠着补贴、市场容量、制造业优势(这次是数据源优势),能弯道超车,起码不落后。
包括腾讯、阿里、字节、小红书、菜鸟等互联网公司,已经在NPL算法工程师等相关招聘岗位中,加入了从业者需了解熟悉GPT-3等相关模型的要求。而招聘的月薪多在4万元左右,最高可达10万元。
2023年,ChatGPT点燃的这把火,可以淬炼出真金的企业和人才,也可以蒸发掉虚妄的概念。最后想说的是,ChatGPT是开胃菜,GPT4.0才是大餐。