BTC

ETH

HTX

SOL

BNB

简中

繁中

English

日本語

한국어

ภาษาไทย

Tiếng Việt

フラッシュニュース

ホットスポット

ダウンロード

設定

More

ログイン

OpenAIがLifeSciBenchを発表：AIシステムの実際の科学研究環境における能力を評価

2026-06-19 15:29

Odaily星球日报社 OpenAIは、AIシステムの実際の科学研究環境における能力を測定するために設計された新しい評価ベンチマーク「LifeSciBench」を発表しました。LifeSciBenchは、750の専門家が作成したタスクに基づいており、7つの科学研究ワークフローと7つの生物学分野をカバーしています。タスクは、博士号を持ち、バイオテクノロジーまたは製薬業界での経験を持つ173名の科学研究従事者によって提供されました。このベンチマークは、単なる事実確認問題ではなく、エビデンス統合、実験設計、データ分析、科学的推論、科学的コミュニケーションなどの複雑な科学研究能力の評価を重視しています。79%以上のタスクが複数ステップの推論を含み、平均して約4つの推論ステップを必要とし、1,062の実際の科学研究関連データファイル（論文、図表、シーケンスデータ、構造ファイルなど）が含まれています。

元のリンク

おすすめ記事

「英伟达概念股」CoreWeave联创访谈：AI需求似乎每天都在加剧

STRCが11%デッキング、Strategyの永久機関はまだ回るのか？

当世界杯碰撞 Agent：从 Web2 到 Web3，钱包如何走向 Agentic Wallet？

Gate 研究院：ストレージ大手3社の時価総額が合計で100兆円突破

検索

24時間フラッシュニュース

2026-06-19 16:58

Iranian Foreign Ministry Deputy: A new mechanism will be adopted to manage the Strait of Hormuz in 60 days

2026-06-19 16:11

美国情報機関が警告：イスラエルが米・イラン合意を妨害する可能性あり

2026-06-19 15:59

特朗普、イラン合意の方向性を固める米国の失敗論を覆す狙い

2026-06-19 15:53

停火消息传出，以军无人机仍持续空袭黎巴嫩南部

2026-06-19 15:45

Iranian Foreign Minister: The US is responsible for any violations of the terms of the memorandum of understanding

2026-06-19 15:34

分析：S&P500の半導体セクターの時価総額比率が18.8%に上昇し、過去最高を更新

Odailyプラネットデイリーアプリをダウンロード

一部の人々にまずWeb3.0を理解させよう

Android

お問い合わせ

パートナーリンク

プライバシーポリシー

Odailyブランドメディアキット | 公式ロゴ・ビジュアルガイドライン

北京瑞克文化メディア有限会社

京ICP备 2026027382号

京公网安备11010502060861号