OpenAI发布最新旗舰级模型GPT4o,ChatGPT迈入人机交互新阶段

2024/05/14 02:14

Odaily星球日报讯 OpenAI 发布最新旗舰级模型 GPT-4o,可以实时推理音频、视觉和文本,主打概念为拟人化、超自然、超低时延的个人语音交互助理。根据 OpenAI 官方网站及 X 平台官方账号相关信息,GPT4o 中的 o 代表 Omni(全面),是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并支持生成任意组合的文本、音频和图像输出。它可以在 232 毫秒内响应音频输入,平均 320 毫秒,与对话中人类反应时间相似。在英语和代码方面,它与 GPT-4 Turbo 性能相当,在非英语语言文本上有显著改进,同时 API 速度更快且成本便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面表现特别出色。文本和图像输入将于今日在 API 和 ChatGPT 中推出,语音和视频输入将在未来几周内推出。

原文链接
最新快讯
16:38
某地址向Hyperliquid存入135万USDC并做以2倍杠杆多PUMP
16:32
逾5.1万枚ETH从沉睡2年的地址转移进新钱包,价值超1.5亿美元,已获20倍收益
16:27
Sunriselayer:空投申领检查器已上线,申领操作将于北京时间15日8时结束,主网及TGE于Q3进行
15:56
质押和验证服务商Arthapala疑似抛售4120枚ETH,价值1219万美元
15:53
Arthur Hayes疑似过去1天购入价值150.5万美元的ENA代币
推荐阅读