文本匿名器

texta-anonymizer的Python项目详细描述


文本匿名者

用于在明文中匿名实体。在

安装

pip install texta-anonymizer

来自Git

pip install git+https://git.texta.ee/texta/texta-anonymizer-python.git

测试

python -m pytest -v tests

文档

文档可用here。在

使用示例

导入匿名器并定义输入数据

fromtexta_anonymizer.anonymizerimportAnonymizertext="""   A. Hitler läks koos oma sõbra Jossif Staliniga poodi.   Adolf ostis kolm pakki suitsu ja Jossif neli saia.   Adolf Hilteri ja J. Stalini majas elab kass.   Hiljem liitus Hitleriga neli koera.   Hitteler ja J. Stalen läksid magama.   Ka Yossif Stalin oli kohal.   Pärast läks A d o l f HITLER joonistama.   """names=[{"first_name":"Adolf","last_name":"Hitler"},{"first_name":"Jossif","last_name":"Stalin"}]

示例

示例1:默认匿名化

^{pr2}$
输出:
>>> print(anonymized_text)
    M.P läks koos oma sõbra F.F-iga poodi.
    M.P ostis kolm pakki suitsu ja F.F neli saia.
    M.P ja F.F-i majas elab kass.
    Hiljem liitus M.P-ga neli koera.
    M.P ja F.F läksid magama.
    Ka F.F oli kohal.
    Pärast läks M.P joonistama.

示例2:禁用拼写错误的名称替换

anonymizer=Anonymizer(replace_misspelled_names=False)anonymized_text=anonymizer.anonymize(text,names)
输出
>>> print(anonymized_text)
   O.W läks koos oma sõbra A.C-ga poodi.
   O.W ostis kolm pakki suitsu ja A.C neli saia.
   O.W Hilteri ja A.C majas elab kass.
   Hiljem liitus O.W-ga neli koera.
   Hitteler ja J. Stalen läksid magama.
   Ka Yossif A.C oli kohal.
   Pärast läks O.W joonistama.

例3:禁用替换单个名和姓

anonymizer=Anonymizer(replace_single_first_names=False,replace_single_last_names=False)anonymized_text=anonymizer.anonymize(text,names)
输出
>>> print(anonymized_text)
   T.N läks koos oma sõbra U.W-ga poodi.
   Adolf ostis kolm pakki suitsu ja Jossif neli saia.
   T.N-i ja U.W majas elab kass.
   Hiljem liitus Hitleriga neli koera.
   Hitteler ja U.W läksid magama.
   Ka U.W oli kohal.
   Pärast läks T.N joonistama.

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
二进制字符串的java NumberFormatExceprion   java如何在Neo4j中查找/匹配/选择标识符名称   java哪一年的日期与原始年份相同?   java什么时候JAXB可以用于Json而不是XML?   java使用PayPal权限API进行PayPal支付   java Getting error在使用安卓 vision api扫描二维码时加载图像失败   java直接突出显示RichTextFX中的一个文本范围   java Resolve@RegisteredAuth2AuthorizedClient,其令牌在spring Security 5.2的spring server之外获得。十、   yyyymmddhhmmss的Java正则表达式   java我试图将google recaptcha与spring mvc集成,但GreCaptCharResponse总是返回false。这里有一些代码   java使用JsonPath将文本转换为json   java无法解析符号。Maven依赖项已就位,但代码为红色   java使用循环查找范围内具有不同数字的数字   java这个SwingWorker是否不重用ThreadPoolExecutor中的线程?