从名字中找出性别。
SexMachine的Python项目详细描述
这个包使用jorg michael(描述了here)的程序“gender”中的底层数据。它的使用非常简单:
>>> import sexmachine.detector as gender >>> d = gender.Detector() >>> d.get_gender(u"Bob") u'male' >>> d.get_gender(u"Sally") u'female' >>> d.get_gender(u"Pauley") # should be androgynous u'andy'
结果将是andy(雌雄同体)、male、female、mostly_male或mostly_female之一。任何未知的名字都被认为是。此外,您可以将未知值设置为任意值:
>>> d = gender.Detector(unknown_value=u"ferhat") >>> d.get_gender(u"Pauley") u'ferhat'
i18n完全受支持:
>>> d.get_gender(u"Álfrún") u'female'
此外,您还可以优先选择特定的国家:
>>> d.get_gender(u"Jamie") u'mostly_female' >>> d.get_gender(u"Jamie", u'great_britain') u'mostly_male'
此外,还可以创建不区分大小写的检测器(默认情况下,是区分大小写):
>>> d = sexmachine.detector.Detector(case_sensitive=False) >>> d.get_gender(u"sally") u'female' >>> d.get_gender(u"Sally") u'female'
尽量避免创建多个检测器,因为每次创建都意味着读取数据文件。
许可证
生成器代码在gplv3下分发。数据文件nam_dict.txt是在GNU自由文档许可下发布的。