OpenAI再惊人动作 引爆A股人工智能板块飙涨
人工智能领域的领军企业 OpenAI 近期再度发力,于 5 月 14 日举行的线上“春季更新”活动中,发布了其最新旗舰生成式 AI 模型 GPT-4o。
这款模型甫一发布,就引发热议。“新版 GPT 可以与人视频互动”“GPT-4o 可检测人的情绪”等相关话题相继登上热搜。
据西南交通大学计算机与人工智能学院副教授、博士生导师邢焕来透露,与同类模型相比,GPT-4o 不仅拥有全面多模态能力、超强实时交互性,还能深入理解语音和情感,或将为用户提供更加强大、更加灵活且易于上手的 AI 工具。
GPT-4o 性能大幅提升
据 OpenAI 官网介绍,GPT-4o 中的“o”代表“Omni”,即“全能”。作为 OpenAI 的最新旗舰模型,GPT-4o 继承了 GPT-4 的核心功能,并在多个方面进行了明显优化和提升。
具体来说,在多模态交互方面,GPT-4o 能够综合处理和生成文本、音频和图像的任意组合(无论输入还是输出),从而应对更加复杂的任务。
与此前版本相比,GPT-4o 拥有更好的实时交互能力,与用户对话几乎无延迟,能够在 232 毫秒内响应音频输入,平均响应时长仅为 320 毫秒(此前 GPT-3.5 为 2.8 秒,GPT-4 为 5.4 秒),堪比人类反应速度。
在网络直播中,GPT-4o 展示了实时推断文本、音频、视觉(图像和视频)的能力。尤其在视觉感知方面,该模型可以通过摄像头识别画面并对其进行描述;在语音方面,即使对话中途被打断,也能继续下去。这些都是实现逼真语音对话的重要标志,也是当前众多人工智能语音助手普遍面临的技术难点。
GPT-4o 还被认为拥有一定的情绪感知能力,不仅可以通过识别图像或声音感知人的情绪,模型本身也能在一定程度上表达自己的“情绪”,大幅提升语音交互的质量和准确性。
香颂资本董事沈萌表示,“GPT-4o 的发布一方面会引发新一轮的 AI 概念热潮以及相应的军备竞赛;也有利于提升 OpenAI 的估值。”
免费背后行业“开卷”
值得注意的是,GPT-4o 发布后,人们更为关注的是该模型将对所有用户免费开放,无需付费即可使用,这提高了其普及性和可访问性。
邢焕来指出,GPT-4 和其他高级模型通常仅提供给付费用户,这限制了普通用户直接接触这些模型,而 GPT-4o 的免费开放释放出了几个重要信号:
一方面,随着各类大模型的不断问世,此前依赖的付费订阅、API 调用收费的盈利模式增长乏力,GPT-4o 的免费开放意味着 OpenAI 可能通过扩大用户基础来获取更多的收入,从而探索新的盈利模式。
随着 AI 市场竞争的加剧,OpenAI 通过提供免费的高级技术,可以吸引更多用户使用其产品,进而增加自己在 AI 市场上的影响力和地位。这也意味着 OpenAI 可能正在加大研发投入,不断推出更具创新性和领先性的产品,以在激烈的竞争中保持优势地位。
OpenAI开放GPT-4o模型可谓豪迈决断,它将带来多重影响:用户基础扩大、成本增加、激发创新、数据和反馈增长。尤其是盈利模式将受到冲击,OpenAI亟需寻觅新的营收途径。
GPT-4o发布也引发了市场热议。5月14日,傅盛评论道,这体现了人工智能应用的巨大潜力,同时堆积参数提高大模型能力并非易事,GPT-5.0可能尚需时日。
值得一提的是,在OpenAI开放GPT-4o之前,各大厂商的AI产品已呈现降价趋势。业界认为,大模型竞争加剧,叠加技术迭代和成本下降,AI领域或将迎来新一轮技术战和价格战。
中国AI市场面临挑战
5月14日,A股人工智能板块逆势上涨,虚拟人、多模态模型等概念股领涨。GPT-4o对中国大模型行业的影响,邢焕来指出其机遇与挑战并存。
技术层面,三模态端到端实时输入输出可行,提高了模型的情感理解能力。
应用领域,GPT-4o的实时响应能力提升,扩展了AI应用范围。
多模态支持和交互能力增强,丰富了AI应用场景,提升了语音助手等应用的业务能力。
挑战方面,美国企业在技术生态、数据优势和风险投资市场方面领先,对中国AI产业构成压力。
除GPT-4o外,谷歌I/O开发者大会和苹果公司人工智能进展也备受关注。大语言模型性能提升和AI技术的进步,也引发了数据隐私、技术伦理和社会问题的担忧。
随着人工智能(AI)在日常生活中的普及,数据隐私和安全性问题日益突出。保障用户数据的安全和隐私成为一项重大课题。
邢焕来指出:“AI技术的发展虽然带来便利,但也可能部分取代传统领域的人力,例如自动化业务和在线客服等。这将影响传统岗位的就业状况,引发就业、伦理等社会问题。”