从名字中找出性别。

gender-guesser的Python项目详细描述


https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

这个包使用jorg michael(描述了here)的程序“gender”中的底层数据。它的使用非常简单:

>>> import gender_guesser.detector as gender
>>> d = gender.Detector()
>>> print(d.get_gender(u"Bob"))
male
>>> print(d.get_gender(u"Sally"))
female
>>> print(d.get_gender(u"Pauley")) # should be androgynous
andy

结果将是unknown(找不到名称)、andy(雌雄同体)、malefemalemostly_malemostly_female之一。andyunknown的区别在于前者被发现具有与女性相同的男性概率,而后者则意味着在数据库中找不到该名称。

i18n完全受支持:

>>> print(d.get_gender(u"\xc1lfr\xfan"))  # u"Álfrún"
female

此外,您还可以优先选择特定的国家:

>>> print(d.get_gender(u"Jamie"))
mostly_female
>>> print(d.get_gender(u"Jamie", u'great_britain'))
mostly_male

此外,还可以创建不区分大小写的检测器(默认情况下,区分大小写):

>>> d = gender.Detector(case_sensitive=False)
>>> print(d.get_gender(u"sally"))
female
>>> print(d.get_gender(u"Sally"))
female

尽量避免创建多个检测器,因为每次创建都意味着读取数据文件。

许可证

生成器代码在gplv3下分发。数据文件nam_dict.txt是在GNU自由文档许可下发布的。

更改日志

0.3.0(2016-07-02)

  • 删除unknown_valueinit选项,因为如果需要的话,可以很容易地用包装器实现它。
  • 找不到名称时返回unknown,对男性和女性都同等有效时返回andy
  • 作为doctests测试自述示例。
  • 修正了在数据文件转换为utf-8后,由于行长度更改而导致的非iso886-15名称的国家性别检测错误。见GH2。谢谢@miquelcamprodon。

0.2.0(2015-12-06)

  • tox连接到python 2和python 3中进行测试。
  • python 2和3兼容。
  • 删除过时的字符映射器代码。

有关早期版本,请参见sexmachine

学分

这是由Ferhat Elmas生成的SexMachine包的叉。它的创建是为了能够将python 3兼容版本发布到pypi,并且能够在不影响原始作者的情况下添加更多的改进。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在Java中使用工厂设计模式   解析服务器安全性的java最佳实践   java如何解决由于某种原因导致的执行失败?   关于Servlet的java   如何在java中生成一个大的(30MB+)xml文件?   匿名类重写与传递接口,用于在Java中设计回调   java jar从运行时开始。getRuntime()。exec()比从命令行运行的时间长   java Ant脚本排除文件夹(某些文件除外)   java在Windows 10计算机上运行时遇到Maven错误   java Hibernate在同一个表中级联   java PayPal API设置返回URL   java如何在选项卡的右侧显示关闭按钮   当按下Jmenu按钮时,使用java操作侦听器退出程序