图片来源@视觉中国
文 | 贝克街探案官,作者 | 包可萌
过去的一周,朋友圈里的能人们又有了新工作,ChatGPT代注册。
2022年11月,OpenAI推出ChatGPT聊天机器人,以对话的形式与用户进行连续性的交互,与此前常见的Siri、小艺等手机交互系统不同,ChatGPT不仅可以回答问题,还能完成代码修改、内容创作等。
在此基础上,ChatGPT还具备纠正错误、拒绝不正当要求的能力,这意味着ChatGPT的人工智能程度,远高于此前大火的AIGC。虽然目前已经有团队绕开ChatGPT的安全限制,但自古至今哪个技术的发展不是一波三折?
2月10日,国内科技圈头部企业华为公开表示,公司早在2020年就布局了相关领域,2021年发布的鹏城盘古大模型就是类ChatGPT产品,也是业界首个千亿级生成和理解中文NLP大模型。除了华为之外,京东本月已经推出产业版竞品“chatJD”,百度也将于3月推出类ChatGPT产品。
而那些还没入局的企业,正在迫不及待想要涌入该赛道。美团联合创始人王慧文在社交平台宣布,将要带着5000万美元组队切入该赛道,而且根本不在意岗位、薪资和title。
由此可见,ChatGPT已经在科技圈掀起新浪潮,可是它和之前的aigc产品到底有什么不同?是否又是昙花一现,大众过了新鲜劲儿后是否会将其抛之脑后?
01 ChatGPT和AIGC有什么不同?
虽然ChatGPT和AI作画软件等同属于AIGC领域,但是ChatGPT除了绘图外,还可用于文本、视频等内容的“原创”,且比此前的AIGC产品更拟人化。
而且ChatGPT还可用于3D交互以及包括开启科学新发现、创造新价值和意义,因此Gartner将生成性AI列为2022年5大影响力技术之一,MIT科技评论也将AI合成数据列为2022年十大突破性技术之一。
ChatGPT之所以能显著区分于其他竞品,主要是因为其引入了RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)的训练方式,从而在训练中增强了人类对模型输出结果的调节,促使模型输出结果更具备理解性。
得益于其更强的互动性,ChatGPT已经达成1亿月活用户里程碑,并开始向用户收费。其竞品如科大讯飞等商业化进程已经被远远甩开。而且科大讯飞付费使用的软件服务中,还停留在语音文件和文字的互转领域,略带交互功能的付费产品则是采取软硬件打包出售的形式。
而在语义交互在这个领域内,国内企业科大讯飞其实更具优势,首先是在知识推理阅读理解比赛 OpenBookQA、QASC 中夺冠,从其在比赛中的表现来看,科大讯飞相关训练模型已经超出人类平均水平,甚至在逻辑推理阅读理解比赛ReClor中刷新全球最好成绩。
只可惜科大讯飞没有基于此率先推出类似ChatGPT的产品。ChatGPT的出现,其实意味着人工智能算法的进一步升级。采用Transformer模型的ChatGPT,首先是突破了RNN 模型不能并行计算的限制;其次关联所需的操作次数不随距离增长。得益于新模型的应用,ChatGPT的解释力度更强。
根据CDSN数据,Transformer的综合特征提取能力、远距离特征捕获能力、语义特征提取能力,全部明显增强。另据机器之心消息,
自从ChatGPT上线后,全新的AI模型因为能回答问题、编写代码、自行创作,
被认为是下一代搜索引擎的雏形,但目前远未达到替代传统搜索引擎的地步。但是伴随硬件的提升以及算法进一步完善,传统搜索引擎的日子确实不好过了。
02 ChatGPT背后是行业变革
ChatGPT席卷社交圈的背后,是其正在逐渐推动科技业加速变革。
具体来看,Meta今年的资本开支将下调40亿美元,减少部分数据中心投资,转而支持AI等相关产品。微软、谷歌等也将在调整资本开支的前提下进一步加速对于AI相关的投资。
其中微软的操作最引人瞩目,显示宣布在3月31日前裁员1万人,中国区裁员比例不高于5%,就在其宣布裁员的前一天,微软公司CEO、董事长纳德拉在达沃斯经济论坛上表示:新冠暴发期间,科技行业迅速发展,但目前处于需求正常化的阶段,得用更少的钱做更多的事,即用自己的技术提高生产率。
对于规模企业而言,提高生产率最简单粗暴的手段自然就是裁员。就目前来看,ChatGPT可以有效提升内容创作者的工作效率,反映在二级市场上,微软宣布裁员当天,美股盘前上涨1.5%。
其实作为科技业老兵,微软早就着手用机器代替人工,早在2019年和2021年,微软就两次投资OpenAI,近期又有消息称,微软计划再向OpenAI注资100亿美元。有分析指出,这次万人裁员是日前风靡科技界的ChatGPT带来的直接结果。
ChatGPT持续热度下,AI投资已经成为北美各大云厂商下阶段投资主力,海外云巨头已经开始加速布局。根据德邦研究所统计,谷歌、微软等传统科技企业,均完成了AIGC领域的布局。
AIGC 基础设施层面,OpenAI、Stability.ai 等已经牢牢占据头部位置,他们主要负责预训练模型,但盈利模式却截然相反。
Stability.ai目前的估值超过10 亿美元,公司目前将其基础版的产品完全对外开源,其盈利模式主要基于面对客户开发和销售专业版和定制版。OpenAI 的盈利模式基于公司对其受控 api 的外部调用来进行收费操作
中间层由于需要满足垂直化、个性化、场景化的应用特点,所以参与企业较多,所有涵盖模型即服务(Model-as-aService,MaaS)的企业均属于AIGC行业中间层;应用层面,由于下游消费者的的需求占据重要地位,需求与AIGC模型的无缝衔接助推产业应用发展。
行业下游以内容创作者为主,他们可以凭借前两层预训练好的模型,以及C端消费级显卡的算力来挖掘出更为丰富的应用场景和内容。目前接近C端用户的工具日渐丰富,包括网页、移动端小程序、基于AIGC的自主画图服务等。
那么谁能限制正在狂飙的ChatGPT?这个答案其实显而易见,那就是算力。
除了内容创作者依赖消费级显卡完成工作外,负责模型预训练的上游企业,如OpenAI等也需要稳定高效的算力资源。
2018年OpenAI推出GPT-1模型,参数量达到1亿级别,2019、2020年OpenAI又陆续迭代出GPT-2、GPT-3模型,参数量分别为15亿、1750亿。随着模型参数量提升,算力需求随之加大。
国内企业想要在aigc方面获得长足发展,首先就是解决算力支撑问题。由于种种不可抗力,国内人工智能领域先后经历多次海外大厂限制芯片供应的问题,国内显卡厂商中,景嘉微正在稳定推动显卡产品迭代,其2022年5月发布的JM9系列第二款GPU芯片,已经能满足地理信息系统、媒体处理、CAD辅助设计、游戏、虚拟化等高性能显示需求和人工智能计算需求,但并不足以实现国产替代。
目前AIGC发展的天花板,仍旧掌握在英伟达、AMD等海外芯片大厂手中,但AIGC由于尚处于高速发展期,英伟达、AMD现有产品足以应对AIGC所需。在算力加持下,AIGC带来的冲击已经向科技业外的各行各业蔓延。
03 ChatGPT虽然有风险,但也被同行羡慕
AIGC作为内容创作工具,发展的越先进,对人们生活工作的正反馈就越强,但是和“P2P”一样,作为新技术,总会被别有居心的利用。
关于ChatGPT的报道中,让人印象最深刻的是多家大学明确禁止学生使用ChatGPT写论文,为应对ChatGPT在文字工作中的“超能力”,大学教授们正在重新设计他们的课程评估体系,比如增加更多的口试、小组工作等。
只是这种“掩耳盗铃”式的限制手段,根本不可能避免有人使用ChatGPT完成学术论文,国内某法学教师预计,ChatGPT很有可能引发学术乱象问题。
一个人工智能软件,引发学术乱象,你敢想象吗?
实际上,在ChatGPT之前,人工智能软件早就渗透入论文创作、出版的各个环节,比如PaperPal和Writefull早就被用于论文写作,类似Wiley'sRex之类的软件还能自动从论文中提取数据,其他诸如查重、排版等领域,也都不乏人工智能的身影。但都没有引发学术界的恐慌,更不会明确要求学生禁止使用。
因为ChatGPT出现前的各类软件,主要为创作者提供辅助作用,而ChatGPT可以担负更重要任务,甚至可以替代作者完成整篇文章的写作。长此以往下去,也许在未来某一天,一台经过调校的机器,可以成为一名合格的执行者,人只需要提想法,类似ChatGPT的软件就能直接产出论文,甚至连论文格式都不用调整。
这种背景下,图灵奖得主、Meta的首席AI科学家Yann LeCun公开吐酸水,ChatGPT胡说八道,你们却不管不顾,我们的Galactica上线三天,就被骂下架了。
不得不说,作为深度学习三巨头之一的Yann LeCun,表达的专业观点不会出原则性问题,比如“大型语言模型并没有物理直觉,它们是基于文本训练的……它们的回答,也可能是完全错误的。”“依靠自动回归和响应预测下一个单词的LLM是条歪路,因为它们既不能计划也不能推理。”
但是落实到具体应用上,都可能出错的前提下,谁的产品错误率更低谁就能在市场上存活,显然月活突破一个亿的ChatGPT已经实现了这个目标,即便是三巨头之一的Yann LeCun,也只有羡慕的份儿。羡慕到自己的产品在ChatGPT面前一无是处,只能下线,自己的工作成果似乎瞬间归零。
或许给ChatGPT一点时间,也许它真的能给你一个惊喜,或者,接替你的工作,你升职加薪或者就此失业。(本文首发钛媒体APP)