OpenAI近日开源了一款专门用于检测和编辑文本中个人身份信息(PII)的模型——OpenAI Privacy Filter。该模型拥有15亿总参数,支持128K的上下文长度,并且能够在本地环境中运行。其采用双向token分类架构,可识别姓名、地址、邮箱、电话、账号、密码等8类隐私信息,在PII-Masking-300k基准测试中取得了96%的F1分数。
OpenAI近日开源了一款专门用于检测和编辑文本中个人身份信息(PII)的模型——OpenAI Privacy Filter。该模型拥有15亿总参数,支持128K的上下文长度,并且能够在本地环境中运行。其采用双向token分类架构,可识别姓名、地址、邮箱、电话、账号、密码等8类隐私信息,在PII-Masking-300k基准测试中取得了96%的F1分数。