国盛证券:OpenAI发布GPT-4o 多模态实时交互能力重大突破

来源: 海外网
2024-05-14 09:46:26

生命死后器官还能复活?科学家有望重新定义死亡申鹤乳业狂飙翻白眼流口水图片,

  发布会直播展示惊艳多模态交互能力,可以进行实时视频交互。GPT-4o(“o”代表“omni全能”)接受文本、音频和图像的任意组合作为输入,直播中GPT-4O展示了实时语音交流能力,响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

  GPT-4o 的文本和图像功能今天开始在 ChatGPT 中推出。GPT-4o会 在免费套餐中提供,向 Plus 用户提供高达 5 倍的消息限制。在未来几周内OpenAI将在 ChatGPT Plus 中推出带有 GPT-4o 的新版本语音模式。开发人员现在可以在 API 中将 GPT-4o 作为文本和视觉模型进行访问。与 GPT-4 Turbo 相比,GPT-4o 的速度快 2 倍,价格减半,速率限制高出 5 倍。

  风险提示:AI技术迭代不及预期;算力紧缺的风险;宏观经济下行的风险。

责任编辑: 凌辰

发布于:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有