DeepSeekがDeepSeek-OCR 2をリリース、AIが人間と同じ論理順序で画像を「見る」ことができる
2026-01-27 05:56
Odailyのニュースです。DeepSeekは新たなDeepSeek-OCR 2モデルをリリースし、革新的なDeepEncoder V2手法を採用しました。これにより、AIは画像の意味に基づいて画像の各部分を動的に並べ替えることができ、もはや機械的に左から右へスキャンするだけではなくなりました。この方法は、人間がシーンを観察する際に従う論理的プロセスを模倣しています。その結果、このモデルは、文書や図表などのレイアウトが複雑な画像を処理する際に、従来の視覚-言語モデルよりも優れた性能を発揮し、より知的で因果推論能力に優れた視覚理解を実現しました。(金十)
