Sahara AI, 마이크로소프트와 협력하여 AI 추론 평가 벤치마크 MATHVISTA 출시
2026-03-18 13:11
Odaily 소식 인공지능 회사 Sahara AI가 마이크로소프트와 협력하여 마이크로소프트에 고정밀 레이블링 데이터를 제공하고, 공동으로 오픈소스 벤치마크 MATHVISTA를 출시한다고 발표했습니다. 이 벤치마크는 GPT-4V, Claude, Gemini 등의 모델이 실제 시나리오에서의 추론 및 의사 결정 능력을 테스트하기 위해 특별히 설계되었으며, 현재까지 누적 다운로드 횟수가 27만 회를 넘었습니다.
현재 마이크로소프트, 아마존, 스냅 및 매사추세츠 공과대학(MIT) 등 기관들은 이미 Sahara AI의 데이터 서비스와 에이전트형 AI 솔루션을 채택하고 있습니다.
