出品 | 搜狐科技
作者 | 梁昌均
在国内外大模型纷纷追赶之际,OpenAI在发布GPT-4半年后迎来重磅更新。
北京时间11月7日凌晨,OpenAI举办首届开发者大会。OpenAI CEO 山姆·奥尔特曼(Sam Altman)在会上透露,目前每周有一亿人使用ChatGPT,宣称OpenAI是目前世界上最先进、应用最广泛的AI平台。
自今年3月通过API发布ChatGPT和Whisper模型以来,OpenAI已获得200多万开发者,其中包括 92%以上的财富500强企业。
“GPT-4仍然是世界上最有能力的模型,在过去的几个月里,我们推出了语音和视觉功能。”奥尔特曼表示,“数字永远不能说明全貌,真正重要的是人们如何使用人工智能产品。”
为此,OpenAI推出功能更为强大、成本更低的新模型GPT-4 Turbo,并意图通过提供定制服务的GPTs、大模型应用商店GPT Store、开发者助手Assistants API(应用程序接口)等打造更为全面的大模型应用生态,推动AI Agent(AI助手)成为现实。
全新大模型升级,成本下降2/3
“过去一年里,我们花了很多时间与世界各地的开发人员交流,听到了很多反馈。”奥尔特曼表示,基于这些反馈,OpenAI宣布推出新的模型GPT-4 Turbo,它将能解决更多问题,具体有方面的改进。
第一,更长的上下文长度。GPT-4 Turbo支持上下文长度多达128K,可容纳相当于300多页文本的内容,而GPT -4仅能支持8K,某些情况下最高也只有32K。但相较百川智能最近推出的Baichuan2-192K 具备的 192K 长度(能处理约35个汉字),GPT-4 Turbo还有差距。
第二,更多的控制。开发人员需要对模型、响应和输出进行更多的控制,OpenAI通过多种方式解决了这个问题,开发了名为Json Mode的新功能,它确保模型将使用有效的响应,将使调用API变得更加容易。该模型可以一次调用多个功能,更好地遵循指示。
OpenAI还推出了一项名为“可再现输出”的新功能,实现模型可重复输出,从而更好地控制模型行为,但目前还是测试版。OpenAI还推出了能记录GPT-4 Turbo、GPT-3.5 Turbo最有可能输出token的概率的日志工具。
第三,更好的世界知识。OpenAI在GPT-4 Turbo平台中启动检索功能,开发人员可以将外部文档或数据库中的指示带入其正在构建的内容中。同时,GPT-4 Turbo的知识库时间也从2021年更新到2023年4月。“随着时间的推移,我们将继续改进这一点。”奥尔特曼表示。
第四,新的视觉模态。OpenAI将为GPT-4 Turbo提供视觉支持,可以通过API接受图像作为输入,能完成生成标题、详细分析以及阅读带有图形的文档等。开发人员可以将DALL·E 3直接集成到企业的应用程序和产品中,而每生成一张图像的起价为0.04美元。
同时,GPT-4 Turbo还将具备语音功能,开发人员能通过文本转语音API生成更自然的语音文件,OpenAI新TTS模型提供了六种预设声音及两种模型变体,每输入1000个字符起价为0.015美元。奥尔特曼认为,语音可以使应用程序的交互更自然,更容易访问,它也解锁了很多用例,比如语言学习和语音助手。
第五,定制微调。penAI将邀请用户积极申请GPT-4微调实验性访问计划,允许开发人员创建ChatGPT的自定义版本。但OpenAI表示,与GPT-3.5微调实现的实质性收益相比,GPT-4微调需要更多的工作来实现对基本模型的有意义的改进。为此OpenAI提供了一个Plus版本的微调,即自定义模型,但能用到的用户不会太多,而且非常贵。
最后,更高的速率限制。GPT-4用户可以享受到每分钟速率限制翻倍的体验,如果不够满意,还可以进一步通过API账户,申请进一步提升速率限制。这将帮助开发人员扩展应用程序,开发成本也能大幅降低。
在发布前述能力升级之后,OpenAI还拿出了“最具诚意”的更新——大幅降价。GPT-4 Turbo输入tokens单价为0.01美元,是GPT-4的1/3;输出tokens单价为0.03美元,是GPT-4的1/2。奥尔特曼表示,OpenAI正在降低整个平台的价格,GPT-4 Turbo总体成本将比GPT-4减少2/3,对开发人员来说运行成本更低。
OpenAI还降低了GPT-3.5 Turbo成本,其输入tokens比之前的16k模型价格便宜1/3,输出tokens便宜1/2,单价分别是0.001美元和0.002美元,综合成本也比原来降低2/3。
推出AI助手、GPT Store,或与微软开启竞争
除了让大模型更好更省,OpenAI还想让大模型变得人人可用。奥尔特曼发布了人人都可参与的GPTs和GPT Store,前者类似定制版的ChatGPT,后者则类似GPT版本的App Store。
阿尔特曼强调,ChatGPT将变得更智能化、个性化和可定制。它会询问用户需要什么,进而帮助用户完成任务,这在AI领域常被称为“Agent”(代理),或者说是AI助手。
GPTs新服务就可以让用户构建一个定制版的ChatGPT,然后发布给其它人使用,其结合了指令、扩展知识和行动,将具备更好的控制力,在工作、休闲场景中能发挥更好的助手作用。
根据现场演示,构建个人GPT时的方式非常简单,几分钟就可完成,不要求用户会写代码,也不需要成为产品经理,只要能把自己的需求提供给ChatGPT与其对话就行,降低了用户使用大模型的门槛。
GPT Store将在本月晚些时候推出,供开发者上传其开发的专业GPT应用。阿尔特曼还表示,它会像App Store一样展示最受欢迎的GPT,OpenAI也将拿出收入的一部分,向推出最有用和最常用GPTs的开发者付费,从而培育一个充满活力的生态。
在大模型厂商越发注重行业生态的情况下,OpenAI则看到了应用生态的重要性,GPT Store的推出,意味着未来想使用大模型产品会像直接下载APP一样简单。
对开发者而言,API十分重要。阿尔特曼表示,构建一个类似Agent的API很困难,往往需要数十个开发人员花费几个月的时间。为此,OpenAI推出Assistants API,直接帮助开发者在自己的应用程序中构建AI Copilot,类似为开发者打造了API AI助手。
Assistants API可以提供持久且无限长的线程(Threading),开发者可以将上下文管理工作完全交由OpenAI处理,突破了过去对话上下文的限制。Assistants API还提供三款新的工具,包括代码解释器、检索和函数调用,让开发者使用更加方便。
OpenAI表示,Assistants API即日起开放测试,用户可以在Assistants Playground主页体验,而无需编写任何代码。对于数据安全问题,OpenAI强调称,上传到OpenAI API的数据永远不会用于训练模型,开发人员也可自己删除数据。
此外,值得关注的还有OpenAI与微软的关系,此前不少报道称双方在合作上出现裂痕。此次开发上,阿尔特曼邀请了微软CEO 萨提亚·纳德拉(Satya Nadella)登台对话。在被问到如何看待双方合作时,纳德拉回应称和OpenAI的合作很fantastic(好极了),表示第一次看到GPT时就完全改变了对整个基础模型的看法。
纳德拉表示,微软与OpenAI的合作主要关注两件事:一是模型训练工作涉及庞大的数据并行,微软将持续优化Azure,为模型迭代提供全面基础设施服务,让开发者更好使用到AI带来的技术革新;二是微软将大力构建Copilot系列产品,推动产品快速进入市场。
不过,从OpenAI此次公布的AI助手计划来看,未来其和微软的Copilot或会产生越大越大的竞争。今年以来,OpenAI一直在推动大模型的商业化落地,其最初基本都是依靠微软实现落地,但现在显然OpenAI不再想当一家单纯的技术厂商,也想直接实现更大规模的技术变现,借此打造自己的应用生态。
目前,国内百度、讯飞等以及国外谷歌等公司都在追赶OpenAI的GPT-4,马斯克的xAI公司刚推出的Grok则宣称其性能优于ChatGPT,虽然不及GPT-4,但显然也将其视为对手。随着OpenAI此次迎来重磅更新,也再次将一众追赶者甩在了身后。