您的位置:首页>国际 >内容

围剿 ChatGPT|钛媒体深度

2023-04-25 15:00:55来源:
导读图片来源@视觉中国人工智能(AI)聊天机器模型ChatGPT风潮狂飙超过百日,包括马斯克在内的商界大佬、科技巨头以及各国政府都已开始着手围剿...


图片来源@视觉中国

人工智能(AI)聊天机器模型ChatGPT风潮狂飙超过百日,包括马斯克在内的商界大佬、科技巨头以及各国政府都已开始着手围剿GPT。

钛媒体App获悉,北京时间4月25日凌晨的RSA 2023大会上,美国科技巨头谷歌(Google)宣布推出基于Sec-PaLM LLM大模型技术的谷歌云安全 AI 工作台(Security AI Workbench),与微软GPT-4版Security Copilot竞争。而5天前,谷歌CEO官宣谷歌大脑和DeepMind两大团队合并,组成“Google DeepMind”部门,以应对ChatGPT带来的技术冲击以及领导研发谷歌多模态 AI 模型项目等。

不止是谷歌,亚马逊(Amazon)也加入到了GPT战局,日前推出AI大模型服务Amazon Bedrock等,阻击基于GPT-4的微软云全新大模型云服务方案;亿万富翁、特斯拉CEO马斯克(Elon Musk)日前也成立了一家人工智能公司X.AI,囤下1万张英伟达A100 GPU(图形处理器)芯片,目标要对抗ChatGPT和其背后的OpenAI公司。

GPT的风险问题也引起各国重视,开启了下场调查和监管。

3月31日,意大利打响调查ChatGPT第一枪,要求暂时禁止使用ChatGPT,并对OpenAI公司展开调查;随后法国、爱尔兰、西班牙跟进,欧洲数据保护委员会则成立专门工作组开展调查;下属部门4月11日向公众征求意见,研究是否在新型 AI 模型发布前进行审核认证;马斯克等科技大佬发布公开信为暂停开发 AI 模型之后,微软、谷歌、苹果、英伟达4月12日共同商议并制定AI相关安全协议。

国内方面,3月以来,互联网科技大厂纷纷下场,一些前AI大佬们也重新出山,开启“百模大战”。阿里通义千问、百度文心一言、商汤日日新SenseNova体系、华为云盘古、昆仑万维“天工”和京东言犀等大模型产品陆续公布,创新工场CEO李开复、前百度总裁陆奇、美团联合创始人王慧文、搜狗创始人王小川、前谷歌科学家李志飞等商业大咖陆续下场,加入到这场大模型竞速中。

所有人都已感受到GPT带来的焦虑,纷纷下场开启围剿GPT行动。

据钛媒体App的梳理统计,自去年11月末至今,全球企业、科研机构已经公布总计超过20个大模型产品。

多位行业人士告诉钛媒体App,目前国内类ChatGPT基本等同于GPT-3及以下的技术水平。与最新GPT-4相比,国内产品差距的主要原因与技术不强、算力不够、产品体验差、工程化能力弱等因素有关。

如今,为了争夺“中国版OpenAI”席位,国内 AI 行业处于尴尬局面。如果跟随,不一定有足够资源做出媲美大厂的产品,如果不跟,又很容易被新进入者颠覆。因此,“重复造轮子”情况已然发生,“你有我也要有”、“人人都做大模型”时代正在到来。

OpenAI似乎也开始“灭火”。公司CEO奥特曼(Sam Altman)4月中旬表示,目前OpenAI没有训练GPT-5,而是要继续优化和扩展GPT-4功能,此前消息称GPT-5将会在2023年底公测。

国内外类ChatGPT技术布局及应用场景不完全统计(图片来源:钛媒体App编辑整理)

三方围剿:大厂追赶、大咖下场、政府担忧

谁也没有想到,短短几个月内,AI 就在各行各业掀起了一阵狂风暴雨。

“这两个月GPT大模型风靡全球,远超过去十年 AI 技术与产业的发展热度,也使得过去二十年互联网科技发展被取代。”一位行业人士告诉钛媒体App,她认为这是继2021年“AI 四小龙”(商汤、旷视、云从、依图)集体被美国制裁之后,AI 行业新一轮热潮。

自去年11月发布至今,ChatGPT(Chat Generative Pre-Trained Transformer)访问量已飙升至8.89亿次,也是历史上最快达到1亿月活的应用,而且整个热潮已蔓延至微软、谷歌、英伟达等科技大厂,以及学术界、产业界当中。

从独角兽到大厂,从使用者到投资人,从业界到学术界,所有对其感兴趣的人士都在讨论ChatGPT以及 AI 技术带来的影响与未来发展。

不仅如此,ChatGPT还在不断进化。今年3月初,ChatGPT的APl接口开放,允许开发者技术开发;两周后,GPT-4问世,语言交互长足进步,具备针对文宇、图片进行分析、分类创作等功能,使得ChatGPT成为全球使用人数最多的多模态通用大模型产品;十天后,ChatGPT又开放了插件测试,实质上拥有了自己的应用商店。与此同时,Bing必应搜索引擎和Office套件等微软各类产品均接入GPT-4技术,使微软的 AI 能力领先同行步。

最近一场播客节目中,英伟达CEO黄仁勋直言,GPT-4的突破之一是可以同时学习语言和图像内容,就跟人类学东西一样,阅读图文比只看文字更容易理解事物。

如今,GPT大模型的发展速度已经让外界望尘莫及。所以为了防御,谷歌、百度等科技大厂,马斯克等商业大咖,以及各国政府积极开启“围剿”模式。

今年2月7日,谷歌CEO桑达尔·皮查伊(Sundar Pichai)在官方博客上宣布推出谷歌下一代 AI 对话系统 Bard。随后谷歌展示“多重搜索”功能,并更新多个旗下App,而且砸下超过20亿元投资OpenAI的竞争对手Anthropic,后者估值增至近50亿美元。

3月初,Bard对外开启测试,但效果不如外界预期,和ChatGPT的产品体验相比有一定距离。

4月中旬,皮查伊表示,Bard将从基于轻量级LaMDA模型,升级为更大规模的PaLM模型,他表示升级后,Bard在处理常识推理和编程问题等任务时能力更强,升级版Bard很快推出。“随着时间的推移,将出现能力更强大的模型。我在乎的不只是领先,完全掌控AI模型对我们来说非常重要。”

甚至连“OpenAI黑粉”马斯克也下场参与竞争。

4月14日,华尔街日报援引知情人士称,马斯克计划成立了 AI 初创公司X.AI,与对手OpenAI竞争。据内华达州备案文件显示,美国X.AI公司于今年3月9日就注册成立,目前马斯克担任董事,马斯克家族办公室主任Jared Birchall担任秘书。

据报道,马斯克还从谷歌的AI部门DeepMind等开挖LLM专家,目前已成功挖到约六位,其中包括高级工程师Igor Babuschkin、软件工程师Manuel Kroiss等。

与此同时,国内互联网科技大厂也集体下场。阿里、华为、腾讯、知乎、商汤、百度、京东、360、昆仑万维等企业纷纷进入大模型竞争中,一把手带队,堪称10年来中国科技圈最卷的一个月。

4月18日,GPT产业联盟正式成立。据悉,该联盟由中国移动通信联合会、中国电信、中国移动、中国联通、中国广电等单位共同发起。

不过从整体水平上,国内类ChatGPT还有很大差距。

王小川却告诉钛媒体App,追上GPT-4或者GPT-5,中国企业不会低于两年,可能需要3年左右的时间。周鸿祎也表示差距在三年左右。

而前Google(谷歌)科学家、出门问问创始人兼CEO李志飞告诉钛媒体App,中美大模型的差距为16个月。他解释称,2022年1月谷歌发布指令学习大模型FLAN,之后的2022年10月ChatGPT发布,2023年3月GPT-4发布。中国企业目前发布的一批大模型与FLAN水平相近。

如今,ChatGPT大模型已经成为中国 AI 史上的一个重要发展目标。

华西证券研报总结了现有国产大模型两个特征:“一是头部厂商主导,To B为主要模式,赋能原有优势业务;二是均未对公众大面积开放,未有明确的To C入口,实际水平不透明。”

旷视科技联合创始人、CEO印奇对钛媒体App表示,未来12个月将是AI大模型技术发展的关键节点。他指出,未来的一段时间,能不能有一个公司首先把大模型真的做出来,且性能真的是达到GPT-3.5,这是所有事情的起点。国内一方面要用最艰苦朴素、奋斗的状态来攻坚核心 AI 技术,另外中国 AI 公司想活得长,必须要把大模型商业化。

“大模型这波肯定会‘一地鸡毛’,因为技术这件事情还真不是‘大力出奇迹’。我认为五、六个月之后 AI 行业一定会有很多‘泡沫’,”印奇对钛媒体App表示。

同时,AI 正影响着人类工作和生活,风险如何控制似乎成为了重要课题,各国政府开启对GPT的“围剿”。

  • 3月下旬,意大利数据保护局(Garante)以涉嫌违反数据收集规则为由,对ChatGPT的开放公司OpenAI展开调查,并宣布禁止使用ChatGPT,且暂时限制OpenAI处理意大利用户数据。
  • 4月11日,美国拜登(Joe Biden)已经开始研究是否需要限制ChatGPT等AI工具。下属的国家电信和信息管理局当天就其所谓的问责措施正式公开征求意见,包括具有潜在风险的新AI模型在发布前是否要走认证核准程序。
  • 同一天,中国下发《生成式人工智能服务管理办法(征求意见稿)》的通知,并向社会公开征求意见。
  • 4月13日,法国国家信息自由委员会决定对ChatGPT提出5项指控,并展开调查。同日,西班牙数据保护局也发表声明,称该机构已经正式对ChatGPT可能的违反法律行为展开初步调查程序。

观韬中茂律师事务所合伙人王渝伟认为,生成式 AI 对于监管行业来说是一个非常新的事物,现在针对算法、技术等立法监管并不能完全覆盖目前出现问题,对于监管来说是很大的考验。难点是如何找到一条既能做好监管,又能不影响行业发展的路径。“在具体执行中,对于 AI,立刻出台一个全面监管显然不现实。”

就目前看,关于生成式AI的法规争议问题主要集中在三个方面:知识产权例如版权、商业秘密保护等问题;涉及数据安全与个人信息保护;涉及数据跨境问题。

微软、亚马逊等国际巨头企业亦对自己的员工发出预警,不要与ChatGPT分享公司的相关敏感信息,因为它们可能会被ChatGPT用于训练未来的语言模型。

4月12日,在解决监管机构的担忧后,意大利当局称将暂停对OpenAI处理该国用户数据的临时限制令,OpenAI也将再次在意大利开放。

钛媒体App询问 ChatGPT,为什么科技大厂、商业大佬、各国政府三方会集体围剿GPT?

它认为主要有三个原因:一是GPT威胁到各大科技公司自身的核心技术和市场份额;二是GPT存在一定的道德和伦理问题,引起公众的关注和质疑;三是企业内部存在利益冲突,导致科技大厂集体围剿GPT。


算力、商业化成挑战

算力资源是这场大模型竞争中的入场券。

“超过千亿级别的大模型,它的训练大概需要1000-2000张A100的卡,没有2000张A100的卡,实验都做不了。硬件成本约5000万美金,加上人力、电力、网络支出,一年需要5000万美金到1亿美金的投入。”昆仑万维集团CEO方汉表示。

工信部最新数据显示,截至2022年6月,中国算力总规模仅次于美国排名全球第二,在全球算力分布中占比26%。近5年,中国算力总规模年均增速超过25%,算力需求不断提升。

事实上,尽管 AI 算力发展不是一个新鲜的话题,但随着ChatGPT的崛起,基于服务器芯片的 AI 算力需求愈加强烈,在外界高需求、高关注、高压力之下,现有的服务器瞬时算力很难支撑高达千亿参数的大模型推理训练,大模型已经遭遇算力瓶颈。

4月初,以“访问需求量过大”为由,OpenAI暂停了一天ChatGPT付费服务注册,并在亚洲等区域大规模清理批量注册的OpenAI账号。随后有市场有人猜测,ChatGPT已有GPU(图形处理器)芯片已不够承载目前的用户量,进而质疑ChatGPT的盈利模式是否持久,引发市场关注。

无独有偶。钛媒体App发现,4月17日下午,百度文心一言也出现了访问需求量过大问题,显示“当前使用人数较多,服务可能响应缓慢”。

据央视财经引述一位行业专家称,虽然中国的数据中心已形成较大规模,但智算中心和边缘数据中心的占比仍有待提高。据悉,中国 AI 服务器的市场规模大概400亿至500亿元,今年市场增速将超过30%。

根据英伟达公布的信息,训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片,同时,OpenAI可能至少需要3.24万张A100用于日常推理,显著高于此前训练底层模型时的用量,以此推算,ChatGPT硬件成本达8亿美元以上。

印奇则透露,要做成GPT大模型,至少得要1万张英伟达A100 GPU芯片,硬件投入就需要20亿元,中国目前可用作大模型训练的A100芯片总共只有4万张。

据The Information报道,包括亚马逊、微软、Google 和甲骨文等主要云计算供应商都在限制客户对云服务器的使用,一些客户称租用硬件的等待时间长达数月,核心问题仍是GPU等算力芯片供不应求。尽管像微软这样的厂商已经在其60多个数据中心部署了数十万张GPU芯片,用于 AI 模型的日常推理。

随着GPT-4发布,市场普遍认为需百倍的芯片及其算力支持,英伟达(NASDAQ: NVDA)股价也随即飙升,年初至今大涨86%以上。

不过,受2022年10月半导体出口管制新政影响,英伟达A100及H100以上芯片不能出口给中国客户,从而在硬件上对中国大模型发展形成钳制。

钛媒体App了解到,中国目前能采购的A800实测性能比A100低5%-10%,而最新应用GPT-4的英伟达H100新片,比中国特供版H800的性能差距超过60%。但目前国内拥有英伟达A100/A800的厂商只有阿里、腾讯、字节跳动等几家科技巨头,大部分企业对高端GPU并没有直接采购需求,而是用更经济的调用云服务商的云计算能力,或是租用GPU芯片等硬件设备。

印奇认为,中国 AI 大模型发展过程中,“缺芯”将是风险。他告诉钛媒体App,AI 芯片制造(Fab)是很大的技术难点。

一位行业人士对钛媒体App表示,由于大模型需要巨大的算力支持,现在百度缺少芯片,其正在为文心一言大量、溢价50%以上采购英伟达A100/A800芯片和服务器卡,“百度现在说有多少就要多少。去年百度采购的英伟达服务器芯片现在才发货,现货溢价很高,因为英伟达也在涨价。”上述人士表示。

据芯片分销平台数据,国内A100芯片现货市场价已经从7万元涨至9万元。另据财新,英伟达A800在国内也已被炒到原价2倍多,且紧俏到脱销。

目前,国内外大模型厂商普遍追加了对英伟达GPU的采购预算,而国内厂商未来一年算力需求主要还是在训练,对GPU的需求更高。

不过,国产 AI 芯片算力是否成为大模型“卡脖子”因素还存疑。王小川告诉钛媒体App,中国可以购买的英伟达A800芯片,性能差距不大,目前不会成为“卡脖子”的瓶颈,尤其他对未来国产芯片技术突破有信心。

但清华大学计算机科学与技术系教授唐杰却指出,随着大模型训练参数不断扩大,国内大模型厂商在底层算力的差距将进一步放大。“英伟达H100也逐渐量产了,它训练千亿参数非常快。如果我们未来的芯片不能快速发展,差距会越来越大,目前也没有任何机会跟他们缩短距离。”

一位行业人士向钛媒体App直言,目前国产GPU类型芯片无法取代英伟达A100/H100,国内 AI 芯片很难跑动大模型。

商汤科技联合创始人杨帆今年2月的一次演讲中提到,国产 AI 芯片在产业落地中会遇到两大挑战:一是 AI 芯片与框架耦合性差,适配工作量巨大;二是链路长,国产芯片对 AI 场景的理解能力不强。他提及,训练大模型常遇到“梯度爆炸”或者硬件故障造成机器过载迭机,整个系统都会跟着受到影响,以前迭机频率是10分钟一次。

今年3月业内消息称,英伟达已经向台积电增加A100/H100和A800 GPU芯片生产订单,但其生产交付周期大约为两到三个月。这意味着,企业当下预定英伟达芯片,预计今年下半年或明年才能到货,但届时国内外大模型产品早已遍地开花。

除了算力之外,商业化变现也是GPT大模型发展的另一挑战。

消费端方面,今年2月2日,OpenAI公司宣布推出付费试点订阅计划ChatGPT Plus,定价每月20美元。付费版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等,同时该公司仍将提供对ChatGPT的免费访问权限。据媒体测算,基于1亿用户、每月20美元计算,ChatGPT年收入将超过200亿美元。

同时,企业端方面,OpenAI技术与微软业务融合不断加深,微软正借助GPT技术加持,在搜索广告、云服务模式等领域实现商业化落地。不仅如此,消费端可以明显感受到,当前微软Bing已经集成GPT-4, Office和电子邮件已经集成了由GPT-4驱动的Copilot,可以大幅提升办公效率,吸引更多微软付费用户。

多家券商研报认为,随着GPT-4、文心一言等大模型逐渐优化和完善,搜索引擎、智能客服、内容创作(、广告文案等)等相关应用有望率先商业化,尤其在媒体、广告营销、文学、教育、金融、智能汽车等领域均有望迎来变革。目前,Shopify、返利科技等多家电商相关企业开始接入ChatGPT,称希望提升运营效率。

创新工场董事长兼CEO李开复表示,以ChatGPT为首的AI 2.0将在电商/广告、影视/娱乐、搜索引擎、元宇宙/游戏、金融、医疗领域加速 AI 的商业化潜能,进入提升生产力的应用井喷期,并提高社会生产力。他引述报告称,预计到2032年,AIGC 全球市场规模将超过2000亿美元。

不过,晨星亚洲高级分析师王凯却表示,目前讨论中国企业能否从类ChatGPT产品中获得多少收入或利润还为时过早,大家仍在探索应用场景,仍需要弄清楚国内类ChatGPT产品将如何商业化。

IDC中国研究总监卢言霞则指出,仅仅依靠大语言模型不会为任何公司提供持续的优势,类似 ChatGPT 的技术目前对市场的影响也有限,而从长远来看,许多相关的 AI 模型甚至可能变得无关紧要。很多科技巨头花费大量资金最终可能却无法获得成功回报。

“要做出AI大模型,在硬件工程、算法和数据三方面,都需要专业经验的沉淀和积累,拿到资金和硬件等资源,只是拿到了张入场券而已。”杨帆表示,产业对 AI 的理解不足是重要问题之一。

王小川告诉钛媒体App,他认为最终科技大厂会一人推出一个模型,本轮参与的创业公司里面可能最终只有不到5个大模型会拿到“通行船票”。

人人造大模型,但 AI 不能取代人类

4月12日,微软宣布开源DeepSpeed Chat,帮助用户轻松训练类ChatGPT等大语言模型,用户通过DeepSpeed Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类ChatGPT大语言模型。

例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。

这意味着,这类开源大模型商业化,正使得每个人、每家企业都能拥有自己的ChatGPT。人人造大模型的时代正加速到来。

周鸿祎向钛媒体App进一步解释,现在GPT技术已经开源而且扩散,这个不存在重复开发问题。“就像你可以用公有云的服务,但很多公司也会用私有云、自己的私有数据库,因此每家企业都可以训练一个私有的GPT只给企业自己或客户。从保密和专属需求来说,看企业根据自己的需要设置公用模式或专用模式。”

不过,这种人人造大模型是否存在实际商业化应用需求,技术风险是否存在,目前仍未知。

实际上,ChatGPT不仅让 AI 迎来“iPhone 时刻”,而且还打开了一个 AI 算法的“潘多拉魔盒”。

可以遇见,未来借由通用人工智能(AGI)等新技术,教育、科技、内容生产等几乎全社会各行业都面临着生产力和生产关系的重塑。

高盛公布的一份报告预计,全球未来平均18%的工作岗位或可由生成式AI自动化完成,约有3亿个全职岗位将受影响。由于生成式AI目前还无法进行体力劳动,受影响的主要是白领工作,且对发达国家的影响将比发展中国家更大。

因此,马斯克等千余名业界、学界人士3月29日联署发表公开信质问OpenAI:是否该让 AI 替换人类的工作?是否应该发展非人类思维,让它们最终在数量和智力上超越、淘汰井取代人类?

“虽然 AI 很多能力不断在发展,甚至它的一些能力已经等同于甚至超过人的能力,但是 AI 也永远不会跟人的智能完全划等号。AI 运行还是在人类设计的这些算法,以及教它学的这些数据的基础上,完成他的一些智能的这种理解生成动作等。它并不具备控制人类的能力。”百度CTO王海峰在4月16日一场演讲中表示,他认为 AI 不会产生像人一样的意识行为。

商汤联合创始人、CEO徐立则表示,“AI是生产‘生产力工具’的工具,它将开启软件开发新范式,把我们带入‘新二八定律’的时代,80%的工作由机器完成,20%的工作由人来做。”

更多 AI 行业人士普遍认为,AI 依然是一个辅助工具。

不过,马斯克却认为,人类文明未来面临的最大风险之一是 AI。他认为AI 发展不受限制会带来危险,“人工智能比核弹头危险得多。”

实际上,过去70多年间,全球 AI 技术发展迅猛,尽管此前数据量不够、算法不强、商业化不如预期,但如今,在ChatGPT催化下,全球 AI 行业迎来新一波狂潮。这一次,AI 算法、算力、数据“三驾马车”同步突破,AI 技术已经蓄能完毕,所有人终于可以大展身手。

在 AI 逐渐平民化的今天,商界大佬、科技巨头以及各国政府都开始围剿ChatGPT,建构自己的“护城河”。

随着市场从火热转回冷静,重新回归商业化本质,这场 AI 大模型似乎仍会持续下去。(本文首发钛媒体App,作者|林志佳)

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章