OpenAIがオープンソースモデル「OpenAI Privacy Filter」をリリース、テキスト内の個人情報を検出・匿名化可能
2026-04-22 15:02
Odailyのニュースです。OpenAIは本日、テキスト内の個人識別情報(PII)を検出し、編集(レッドライン処理)することを目的としたオープンソースモデル「OpenAI Privacy Filter」をリリースしました。このモデルは合計15億のパラメータと5000万のアクティブパラメータを持ち、最大12.8万トークンのコンテキストウィンドウをサポートしています。OpenAI Privacy Filterは双方向トークン分類モデルアーキテクチャを採用しており、個人名、住所、メールアドレス、電話番号、URL、日付、アカウント、キーなどの8種類の情報を識別でき、PII-Masking-300kベンチマークテストで96%のF1スコアを達成しました。現在、このモデルはApache 2.0ライセンスに基づきHugging FaceとGitHubで公開されており、開発者がローカルデプロイやファインチューニングを行うことができます。
