BTC

ETH

HTX

SOL

BNB

简中

繁中

English

日本語

한국어

ภาษาไทย

Tiếng Việt

設置

更多

登錄

智谱發佈GLM-5.1高速版API，輸出速度達400 tokens/s

2026-05-22 03:19

Odaily星球日報訊智譜面向部分企業客戶推出 GLM-5.1 高速版 API，其模型輸出速度達到 400 tokens/s，刷新全球大模型官方介面端到端速度紀錄。

據了解，該高速版在保留原有旗艦模型能力基礎上，由智譜與 TileRT 團隊聯合研發的高性能推理引擎驅動。該引擎透過重構 GPU 運行排程機制，將模型靜態編排為常駐 GPU 的 persistent Engine Kernel，以降低傳統推理中的核心啟動與顯存讀寫延遲。

在多卡場景下，TileRT 進一步將 8 卡 NVL 拓撲中的 GPU 節點特化為不同功能 Worker，以提升注意力層計算與跨卡通訊效率。

目前，該高速版服務已向智譜 MaaS 平台部分企業客戶開放。未來將繼續優化 FP8 推理及超長上下文能力，面向 AI 程式設計、即時互動與即時語音等低延遲場景提供支援。

推薦文章

Dialogue with CZ: Don’t think about quitting crypto. If I had to start over, I would still build an exchange.

Support rate below 1%, is BIP-110 still pushing Bitcoin toward a soft fork?

MSX 美股每日觀察：沃什鷹派開場，降息預期被收回

CLARITY Act延誤已成合規危機，而非單純政治僵局

搜索

24小時快訊

2026-07-17 13:46

SK海力士ADR首次跌破149美元的发行价

2026-07-17 13:45

NVIDIA's stock price fell 4.33%, with its total market capitalization shrinking to $4.8 trillion

2026-07-17 13:41

某钱包销毁99,755枚WHYPE，价值超593.5万美元

2026-07-17 13:41

Ethereum Layer2 infrastructure Optimism partners with Dunamu, Toss, and DB Securities to expand into the Korean market

2026-07-17 13:38

Coinbase：部分使用者在以太坊網路上提幣可能出現延遲

2026-07-17 13:36

SpaceX市值蒸發近一兆美元

下載Odaily星球日報app

讓一部分人先讀懂 Web3.0

Android

Odaily星球日報品牌媒體資料包 | 官方Logo與視覺規範下載

北京瑞克文化傳媒有限公司

京ICP备 2026027382号

京公网安备11010502060861号