时间提取器NLP项目-在文本文档中定位日期和时间
pytimeextractor的Python项目详细描述
这个项目是由Digamma.ai开发的。这个项目的目标是 开发库以查找和提取时间/日期信息 文本文件
我为什么要用这个?
主要目标是识别与 时间/日期/期间(确切日期、日期、星期几、月份, 季节、时间间隔等)并以此形成结构形式我们 尝试检测各种文本表示并处理 比如重复出现的时间(比如“每周三”)。
安装
$ pip install pytimeextractor
您还可以下载或签出最新代码并从源安装:
$ python setup.py install
用法
要使用它,只需执行以下操作:
>>> from pytimeextractor import ExtractionService >>> text = "from winter to summer" >>> ExtractionService.extract(text)
可以应用PySettings来指定一些附加提取 选项,如设置本地用户日期/时间、时区偏移、筛选 提取规则并查找最新日期。
PySettingsBuilder用于构造PySettings实例 当需要设置默认设置以外的配置选项时。 PySettingsBuilder最好通过创建它,然后调用它 各种配置方法,最后调用build方法。
>>> from pytimeextractor import PySettingsBuilder >>> settings = (PySettingsBuilder() ... .addRulesGroup('DateGroup') ... .excludeRules("relativeDateRule") ... .addUserDate("2017-10-23T18:40:40.931Z") ... .addTimeZoneOffset("2") ... .includeOnlyLatestDates(True) ... .build() ... ) >>> ExtractionService.extract(text, settings)