風險提示:防範以"虛擬貨幣""區塊鏈"名義進行非法集資的風險。——銀保監會等五部門
資訊
發現
搜索
登錄
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt
BTC
ETH
HTX
SOL
BNB
查看行情
OpenAI發布更新,實現即時跨音訊、視覺和文字推理
2024-10-02 11:34
Odaily星球日報訊 OpenAI 在10 月對其模型進行了四項更新,幫助其AI 模型更好地進行對話並提高影像辨識能力。第一項重大更新是即時API,它允許開發人員使用單一提示創建人工智慧生成的語音應用程序,實現類似於ChatGPT 高級語音模式的自然對話。以前開發人員必須將多個模型「拼接在一起」才能創建這些體驗。音訊輸入通常需要在接收回應之前完全上傳和處理,這意味著語音相互對話等即時應用程式的延遲較高。借助Realtime API 的串流功能,開發人員現在可以實現即時、自然的交互,就像語音助理一樣。該API 運行在2024 年5 月發布的GPT-4 上,可以即時跨音訊、視覺和文字進行推理。另一項更新包括為開發人員提供的微調工具,使他們能夠改進從圖像和文字輸入生成的人工智慧回應。基於影像的微調器使人工智慧能夠更好地理解影像,從而增強視覺搜尋和物體偵測能力。這個過程包括來自人類的回饋,他們提供了好的和壞的反應的例子進行訓練。除了語音和視覺更新之外,OpenAI 還推出了“模型蒸餾”和“提示緩存”,允許較小的模型向較大的模型學習,並通過重用已處理的文本來減少開發成本和時間。路透社報道,OpenAI 預計明年營收將增至116 億美元,高於2024 年預計的37 億美元。 (Cointelegraph)