新闻资讯
  当前位置: 首页 > 新闻资讯

GPT-4震撼登场:语音视频交互开启无限可能,推动AI商业化新蓝海

发布时间:2024-05-21 14:39:23 

5 月 14 日凌晨,美国人工智能研究公司 OpenAI 在线举办了“春季更新”活动。

OpenAI 在活动中发布了新旗舰模型“GPT-4o”,该模型“可以实时对音频、视觉和文本进行推理”。新模型使 ChatGPT 能够处理 50 种不同的语言,同时提高了速度和质量。

GPT-4o 是迈向更自然人机交互的一步,与现有模型相比,GPT-4o 在图像和音频理解方面尤其出色。GPT-4o 可以快速响应音频输入,与人类在对话中的反应时间相近。

在录播视频中,两位高管做了演示:机器人能够从急促的喘气声中理解“紧张”的含义,并指导他进行深呼吸。

相关研报显示,国内 AI 多模态模型不断发展,有望赋能 IP 开发、影视、音乐、教育、营销等领域,带动音视频语料需求,并催生新的变现模式。建议继续关注多模态 AI 应用的布局。

值得买计划采用对话式“AI 问答机器人”与用户交互,用户通过描述购物需求或问题,机器人可智能分析并给出建议或链接。

奥飞娱乐表示,持有光年无限 5% 股权,后者拥有 AI 对话机器人产品——图灵机器人开放平台。公司上线“喜羊羊与灰太狼+”AI 对话小程序,面向儿童用户,提供亲子陪伴体验。