正如之前的预告所说,这周的5月13日,OpenAI发布了新旗舰模型“GPT-4o”,可以实时推理音频、视觉和文本。不同于之前需要付费的GPT-4,GPT4o模型可以提供给所有用户免费使用。

GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。有另外一种解释是GPT-4o名称的由来是“GPT for all”,意味着它可以在能想象到的任何场景实现语音对话、视频对话。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

其他方面,OpenAI将在网络上发布全新的ChatGPT UI,新的主屏幕和消息布局“更具对话性”,同时还将发布桌面版的ChatGPT for Mac,用户可以通过键盘快捷键向ChatGPT提问,也可以通过打字或说话截图并进行讨论(从今天开始,Plus用户将首先获得访问权限,Windows版本的应用程序将于今年晚些时候推出)。此外,ChatGPT的免费用户现在还可以访问GPT Store(OpenAI 基于其人工智能模型构建的第三方聊天机器人库),之前针对免费用户该功能是受限的。

另外,GPT-4o的文本和图像功能已经开始向付费的ChatGPT Plus和Team用户推出,企业用户也即将推出。免费用户也将开始使用,但有使用限制。

通过上面可以看到使用 GPT-4o 时,ChatGPT Free 用户现在可以访问以下功能:

  1. 体验GPT-4智能级别
  2. 从模型和网络获取响应
  3. 分析数据并创建图表
  4. 和它聊聊拍摄的照片
  5. 上传文件帮助总结、写作或分析
  6. 发现和使用 GPT 和 GPT 商店
  7. 使用“记忆”得到更优秀的用户体验
  8. 适用于 macOS 的新 ChatGPT 桌面应用程序

ChatGPT 现在支持超过 50 种语言,包括注册和登录、用户设置等。

感兴趣的同学可以上官网查看部分演示视频和相关技术文档:Spring Update | OpenAI

GPT-4o的出现无疑会对AI带来颠覆性影响,OpenAI通过免费使用战略来应对claude、gemini等大语言模型所带来的冲击,继续自己在GPT领域的统治地位。

分类: AI外网

0 条评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注