BTC

ETH

HTX

SOL

BNB

简中

繁中

English

日本語

한국어

ภาษาไทย

Tiếng Việt

设置

更多

登录

智谱发布GLM-5.1高速版API，输出速度达400 tokens/s

2026-05-22 03:19

Odaily星球日报讯智谱面向部分企业客户推出 GLM-5.1 高速版 API，其模型输出速度达到 400 tokens/s，刷新全球大模型官方接口端到端速度纪录。

据了解，该高速版在保留原有旗舰模型能力基础上，由智谱与 TileRT 团队联合研发的高性能推理引擎驱动。该引擎通过重构 GPU 运行调度机制，将模型静态编排为常驻 GPU 的 persistent Engine Kernel，以降低传统推理中的内核启动与显存读写延迟。

在多卡场景下，TileRT 进一步将 8 卡 NVL 拓扑中的 GPU 节点特化为不同功能 Worker，以提升注意力层计算与跨卡通信效率。

目前，该高速版服务已向智谱 MaaS 平台部分企业客户开放。未来将继续优化 FP8 推理及超长上下文能力，面向 AI 编程、实时交互与实时语音等低延迟场景提供支持。

推荐文章

对话CZ：不要想着退出加密，推倒重来我还是会做交易所

支持率不足1%，BIP-110仍要将比特币推向软分叉？

MSX美股每日观察：沃什鹰派开场，降息预期被收回

CLARITY Act延误已成合规危机，而非单纯政治僵局

搜索

24小时快讯

2026-07-17 12:34

高盛预计美股将迎强劲财报季，标普500成分股二季度盈利将同比飙升22%

2026-07-17 12:31

荷兰加密平台Knaken被法院宣告破产，超700万欧元用户资产失踪引调查

2026-07-17 12:28

欧洲央行警告：稳定币普及或侵蚀银行存款基础，数字欧元加速推进

2026-07-17 12:22

David Sacks回应中国AI模型Kimi K3登顶代码评测：美国监管束缚或削弱竞争力

2026-07-17 12:16

中际旭创获港交所批准拟上市募资80亿美元

2026-07-17 12:04

Abraxas Capital过去3小时从CEX提取12477枚ETH

下载Odaily星球日报app

让一部分人先读懂 Web3.0

Android

Odaily星球日报品牌媒体资料包 | 官方Logo与视觉规范下载

北京瑞克文化传媒有限公司

京ICP备 2026027382号

京公网安备11010502060861号