假名检测

2024-07-05 09:02:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个用户列表。每个用户都有名字和姓氏字段。大多数用户详细信息都是准确的。有时,我可以看到使用虚假详细信息注册的用户

例如:

  • 有效:阿隆面具

  • 有效:Asd Dfds

我正在寻找一种方法来检查这个名字是否合法。解决这个问题的最佳方法是什么

我的开发堆栈是Python


Tags: 方法用户列表堆栈详细信息名字姓氏合法
1条回答
网友
1楼 · 发布于 2024-07-05 09:02:00

您可以使用GoogleCloudeInfotypeAPI从给定字符串中提取信息类型

https://cloud.google.com/dlp/docs/quickstart-json

它的工作原理是向API发送一个Json请求,该请求将以最小的可能性返回您正在查找的信息

电话号码示例:

{
  "item":{
    "value":"My phone number is (206) 555-0123."
  },
  "inspectConfig":{
    "infoTypes":[
      {
        "name":"PHONE_NUMBER"
      },
      {
        "name":"US_TOLLFREE_PHONE_NUMBER"
      }
    ],
    "minLikelihood":"POSSIBLE",
    "limits":{
      "maxFindingsPerItem":0
    },
    "includeQuote":true
  }
}

答复:

{
  "result":{
    "findings":[
      {
        "quote":"(206) 555-0123",
        "infoType":{
          "name":"PHONE_NUMBER"
        },
        "likelihood":"LIKELY",
        "location":{
          "byteRange":{
            "start":"19",
            "end":"33"
          },
          "codepointRange":{
            "start":"19",
            "end":"33"
          }
        },
        "createTime":"2018-11-30T01:01:30.883Z"
      }
    ]
  }
}

https://cloud.google.com/dlp/docs/infotypes-reference#global拥有所有信息类型,您可能希望尝试以下信息类型:

人名 完整的人名,可以包括名字、中间名或首字母缩写以及姓氏。注意:不建议在延迟敏感操作期间使用

名字
名字被定义为人名的第一部分。注意:不建议在延迟敏感操作期间使用

姓 姓氏定义为人名的最后一部分。 注意:不建议在延迟敏感操作期间使用

相关问题 更多 >