BTC

ETH

HTX

SOL

BNB

시장 동향 보기

简中

繁中

English

日本語

한국어

ภาษาไทย

Tiếng Việt

플래시 뉴스

설정

More

로그인

智谱, GLM-5.1 고속 버전 API 출시, 출력 속도 400 tokens/s 도달

2026-05-22 03:19

Odaily星球日报讯 지푸(Zhipu)가 일부 기업 고객을 대상으로 GLM-5.1 고속 버전 API를 출시했습니다. 이 모델의 출력 속도는 400 tokens/s에 달하며, 글로벌 대형 언어 모델 공식 인터페이스의 종단간 속도 기록을 경신했습니다.

알려진 바에 따르면, 이 고속 버전은 기존 플래그십 모델의 성능을 유지하는 동시에 지푸와 TileRT 팀이 공동 개발한 고성능 추론 엔진으로 구동됩니다. 이 엔진은 GPU 실행 스케줄링 메커니즘을 재구성하여 모델을 정적으로 GPU에 상주하는 persistent Engine Kernel로 편성함으로써 기존 추론 과정에서 발생하는 커널 시작 및显存 읽기/쓰기 지연 시간을 줄입니다.

멀티 GPU 환경에서 TileRT는 8卡 NVL 토폴로지 내의 GPU 노드를 각기 다른 기능을 수행하는 Worker로 특화시켜 어텐션 레이어 계산과 카드 간 통신 효율성을 향상시킵니다.

현재 이 고속 버전 서비스는 지푸 MaaS 플랫폼의 일부 기업 고객에게 공개되었습니다. 앞으로 FP8 추론 및 초장기 컨텍스트 능력을 지속적으로 최적화하여 AI 프로그래밍, 실시간 상호작용 및 실시간 음성 등 저지연 시나리오를 지원할 예정입니다.

추천 기사

대화 CZ: "암호화폐에서 나가지 마라, 다시 시작해도 나는 거래소를 만들겠다"

Support Rate Below 1%: Is BIP-110 Still Pushing Bitcoin Toward a Soft Fork?

MSX 미국 주식 일일 관찰: 월시의 매파적 발언, 금리 인하 기대 철회

CLARITY Act 지연, 단순한 정치적 교착 상태가 아닌 규제 리스크로 전환

검색

24시간 플래시 뉴스

2026-07-17 12:31

네덜란드 암호화폐 플랫폼 Knaken, 법원 파산 선고…700만 유로 이상 사용자 자산 실종으로 조사 착수

2026-07-17 12:28

ECB Warns: Stablecoin Adoption Could Erode Bank Deposit Base, Accelerating Digital Euro

2026-07-17 12:22

David Sacks 경고: 중국 AI 모델, 코드 테스트 1위 등극… 미국 규제가 AI 경쟁력 약화시킬 수도

2026-07-17 12:16

Zhongji Innolight mendapat persetujuan Bursa Efek Hong Kong untuk pencatatan saham, target penggalangan dana sebesar 80 miliar dolar AS

2026-07-17 12:04

Abraxas Capital withdrew 12,477 ETH from CEX over the past 3 hours

2026-07-17 12:04

Peter Brandt: 나스닥 선물에서 다이아몬드 탑 패턴 형성, 비트코인 4만 달러 바닥 가능성

Odaily 플래닛 데일리 앱 다운로드

일부 사람들이 먼저 Web3.0을 이해하게 하자

Android

파트너 링크

개인정보 보호정책

Odaily 브랜드 미디어 키트 | 공식 로고 & 비주얼 가이드라인

베이징 루이커 문화미디어 유한공사

京ICP备 2026027382号

京公网安备11010502060861号