OpenAI发布会掀开ChatGPT新篇章,旗舰模型免费赋能实时互动
财联社 5 月 14 日电 北京时间周二凌晨 1 点,OpenAI 举行春季发布会,推出多项与 ChatGPT 相关的更新。
OpenAI 发布了最新的大模型 GPT-4o,与 GPT-4 Turbo 相比,速度更快、价格更低。该模型的语音模式现已达到“实时”响应。
这意味着用户可以与 ChatGPT 轻松对话,打断它的回答并提出更多要求,而无需等到它完成前一个问题的答复。
ChatGPT 的免费用户现可使用 GPT-4o 模型进行数据分析、图像分析、网络搜索和访问应用商店等操作。付费用户将获得更高的消息限制(至少 5 倍)。
当免费用户用完消息后,ChatGPT 将自动切换到 GPT-3.5。
OpenAI 将在未来一个月内向 Plus 用户推出基于 GPT-4o 改进的语音体验。目前 GPT-4o 的 API 不包含语音功能。
苹果电脑用户将迎来一款为 macOS 设计的 ChatGPT 桌面应用。用户可以通过快捷键“拍摄”桌面并向 ChatGPT 提问,Windows 版本将于今年晚些时候推出。
发布会直击回顾
- 01 点 00 分:倒计时结束,直播正式开始。
- 01 点 01 分:首席技术官 Mira Murati 登场,表示将谈论 3 件事情:免费和广泛使用工具的重要性、减少使用 ChatGPT 的障碍以及发布最新的大模型 GPT-4o。
- 01 点 05 分:对于桌面版的 ChatGPT,OpenAI 表示已重新设计了 UI。
- 01 点 08 分:GPT-4o 拥有与 GPT-4 相同的智能,但运行速度更快,并且兼具文字、音频和视频能力。
13:13 在语音模式下,OpenAI 之前需要调用三个模型,这导致体验延迟。GPT-4o 可以在图像、文件和声音上进行推理,自然流畅。
13:17 效率提升使 OpenAI 能够向免费用户提供 GPT-4 级别的智能。
13:19 OpenAI 强调,由于 GPT-4o 带来的效率提升,现在每个人都可以使用 GPT-4。
13:20 GPT 商店目前有超过 100 万个 GPT。免费开放后,GPT 开发者将获得更大的用户群。
13:22 免费用户也可以上传图像、进行分析、使用“浏览器”功能搜索实时信息。GPT-4o 还支持记忆功能和 API,供开发者调用。与 GPT-4 Turbo 相比,GPT-4o 速度快两倍、价格低 50%,速率限制高出 5 倍。
13:25 研究主管 Mark Chen 和 Barret Zoph 展示了一系列新功能。
13:26 Mark Chen 正与 ChatGPT 交谈,ChatGPT 可以理解“紧张”的含义,并指导他进行深呼吸。
13:28 Chen 表示,他的演示说明了在语音模式下,无需再与机器进行机械式问答,可以进行实时沟通。
13:30 在实时演示中,主持人不断要求 ChatGPT 改变语调,包括夸张的语气、机器人的预期和使用“唱腔”讲故事。
13:35 Barret Zoph 启动摄像头,要求 ChatGPT 实时帮助他解决一元方程。
13:37 除了图像识别和解题能力,ChatGPT 还展示了实时根据影像变化与 Barret 交互的能力。
13:40 Barret 进一步展示了 ChatGPT 桌面版对代码和电脑桌面(一张气温图表)进行实时解读的能力。
13:42 Murati 和 Mark Chen 展示了 ChatGPT 进行意大利语、英语的实时交传翻译。
OpenAI 表示,今天的发布会主要针对免费用户,这些功能将在未来几周内向所有用户推送。根据 OpenAI 的官网公告,GPT-4o 将向付费 Plus、Team 用户和免费用户同时推出。Plus 用户的消息限制数量是免费用户的 5 倍,Team 和 Enterprise 用户的可用消息数量更高。当免费用户的使用量达到限制后,ChatGPT 将自动切换到 GPT-3.5,以便继续对话。