BTC

ETH

HTX

SOL

BNB

简中

繁中

English

日本語

한국어

ภาษาไทย

Tiếng Việt

设置

更多

登录

OpenAI发布更新，实现实时跨音频、视觉和文本推理

2024-10-02 11:34

Odaily星球日报讯 OpenAI 在 10 月对其模型进行了四项更新，帮助其 AI 模型更好地进行对话并提高图像识别能力。第一项重大更新是实时 API，它允许开发人员使用单个提示创建人工智能生成的语音应用程序，实现类似于 ChatGPT 高级语音模式的自然对话。以前开发人员必须将多个模型“拼接在一起”才能创建这些体验。音频输入通常需要在接收响应之前完全上传和处理，这意味着语音相互对话等实时应用程序的延迟较高。借助 Realtime API 的流媒体功能，开发人员现在可以实现即时、自然的交互，就像语音助手一样。该 API 运行在 2024 年 5 月发布的 GPT-4 上，可以实时跨音频、视觉和文本进行推理。另一项更新包括为开发人员提供的微调工具，使他们能够改进从图像和文本输入生成的人工智能响应。基于图像的微调器使人工智能能够更好地理解图像，从而增强视觉搜索和物体检测能力。该过程包括来自人类的反馈，他们提供了好的和坏的反应的例子进行训练。除了语音和视觉更新之外，OpenAI 还推出了“模型蒸馏”和“提示缓存”，允许较小的模型向较大的模型学习，并通过重用已处理的文本来减少开发成本和时间。据路透社报道，OpenAI 预计明年收入将增至 116 亿美元，高于 2024 年预计的 37 亿美元。（Cointelegraph）

推荐文章

增长的故事讲完了？甲骨文暴跌背后，市场开始追问回报率

CFTC拟立预测市场新规，重新定义哪些事件能上、谁能参与

SpaceX 冲刺「史上最大 IPO」：商业航天，半只脚迈入公开市场定价时代

警报拉满：日本央行加息25bp在即，美股、加密重现2024式闪崩？

搜索

24小时快讯

2026-06-11 05:30

2026-06-11 05:02

韩国交易所启动SIDECAR机制，暂停韩国创业板指数程序化买入

2026-06-11 04:37

某聪明钱购入10万美元CS2 IEM Cologne 2026 BB战胜MGLZ

2026-06-11 04:04

以太坊现货ETF昨日总净流出3559.31万美元，仅贝莱德（Blackrock）Staked ETH ETF ETHB实现净流入

2026-06-11 04:04

比特币现货ETF昨日总净流出2.14亿美元，持续4日净流出

2026-06-11 04:02

币安将开放SPCX限价单交易，首日仅支持整股限价委托

下载Odaily星球日报app

让一部分人先读懂 Web3.0

Android

Odaily星球日报品牌媒体资料包 | 官方Logo与视觉规范下载

北京瑞克文化传媒有限公司

京ICP备 2026027382号

京公网安备11010502060861号