OpenAI phát hành mô hình mã nguồn mở OpenAI Privacy Filter, có thể phát hiện và ẩn thông tin cá nhân trong văn bản
2026-04-22 15:02
Odaily thông báo: OpenAI hôm nay đã phát hành mô hình mã nguồn mở OpenAI Privacy Filter, nhằm mục đích phát hiện và xử lý (đánh dấu) thông tin nhận dạng cá nhân (PII) trong văn bản. Mô hình này có tổng cộng 1.5 tỷ tham số và 50 triệu tham số hoạt động, hỗ trợ cửa sổ ngữ cảnh lên tới 128 nghìn token. OpenAI Privacy Filter sử dụng kiến trúc mô hình phân loại token hai chiều, có thể nhận diện tám loại thông tin bao gồm tên riêng, địa chỉ, email, số điện thoại, URL, ngày tháng, tài khoản và khóa bí mật, đồng thời đạt điểm F1 96% trong bài kiểm tra chuẩn PII-Masking-300k. Hiện tại, mô hình này đã được công bố trên Hugging Face và GitHub theo giấy phép Apache 2.0, hỗ trợ các nhà phát triển triển khai cục bộ và tinh chỉnh.
