文本匿名器
texta-anonymizer的Python项目详细描述
文本匿名者
用于在明文中匿名实体。在
安装
pip install texta-anonymizer
来自Git
pip install git+https://git.texta.ee/texta/texta-anonymizer-python.git
测试
python -m pytest -v tests
文档
文档可用here。在
使用示例
导入匿名器并定义输入数据
fromtexta_anonymizer.anonymizerimportAnonymizertext=""" A. Hitler läks koos oma sõbra Jossif Staliniga poodi. Adolf ostis kolm pakki suitsu ja Jossif neli saia. Adolf Hilteri ja J. Stalini majas elab kass. Hiljem liitus Hitleriga neli koera. Hitteler ja J. Stalen läksid magama. Ka Yossif Stalin oli kohal. Pärast läks A d o l f HITLER joonistama. """names=[{"first_name":"Adolf","last_name":"Hitler"},{"first_name":"Jossif","last_name":"Stalin"}]
示例
示例1:默认匿名化
^{pr2}$输出:
>>> print(anonymized_text)
M.P läks koos oma sõbra F.F-iga poodi.
M.P ostis kolm pakki suitsu ja F.F neli saia.
M.P ja F.F-i majas elab kass.
Hiljem liitus M.P-ga neli koera.
M.P ja F.F läksid magama.
Ka F.F oli kohal.
Pärast läks M.P joonistama.
示例2:禁用拼写错误的名称替换
anonymizer=Anonymizer(replace_misspelled_names=False)anonymized_text=anonymizer.anonymize(text,names)
输出
>>> print(anonymized_text)
O.W läks koos oma sõbra A.C-ga poodi.
O.W ostis kolm pakki suitsu ja A.C neli saia.
O.W Hilteri ja A.C majas elab kass.
Hiljem liitus O.W-ga neli koera.
Hitteler ja J. Stalen läksid magama.
Ka Yossif A.C oli kohal.
Pärast läks O.W joonistama.
例3:禁用替换单个名和姓
anonymizer=Anonymizer(replace_single_first_names=False,replace_single_last_names=False)anonymized_text=anonymizer.anonymize(text,names)
输出
>>> print(anonymized_text)
T.N läks koos oma sõbra U.W-ga poodi.
Adolf ostis kolm pakki suitsu ja Jossif neli saia.
T.N-i ja U.W majas elab kass.
Hiljem liitus Hitleriga neli koera.
Hitteler ja U.W läksid magama.
Ka U.W oli kohal.
Pärast läks T.N joonistama.
- 项目
标签: