时间提取器NLP项目-在文本文档中定位日期和时间

pytimeextractor的Python项目详细描述


这个项目是由Digamma.ai开发的。这个项目的目标是 开发库以查找和提取时间/日期信息 文本文件

我为什么要用这个?

主要目标是识别与 时间/日期/期间(确切日期、日期、星期几、月份, 季节、时间间隔等)并以此形成结构形式我们 尝试检测各种文本表示并处理 比如重复出现的时间(比如“每周三”)。

安装

$ pip install pytimeextractor

您还可以下载或签出最新代码并从源安装:

$ python setup.py install

用法

要使用它,只需执行以下操作:

>>> from pytimeextractor import ExtractionService
>>> text = "from winter to summer"
>>> ExtractionService.extract(text)

可以应用PySettings来指定一些附加提取 选项,如设置本地用户日期/时间、时区偏移、筛选 提取规则并查找最新日期。

PySettingsBuilder用于构造PySettings实例 当需要设置默认设置以外的配置选项时。 PySettingsBuilder最好通过创建它,然后调用它 各种配置方法,最后调用build方法。

>>> from pytimeextractor import PySettingsBuilder
>>> settings = (PySettingsBuilder()
...          .addRulesGroup('DateGroup')
...          .excludeRules("relativeDateRule")
...          .addUserDate("2017-10-23T18:40:40.931Z")
...          .addTimeZoneOffset("2")
...          .includeOnlyLatestDates(True)
...          .build()
...         )
>>> ExtractionService.extract(text, settings)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java连接usb到uart设备到安卓设备>3.1   可以强制Php中的web应用程序与Java中的桌面应用程序一起工作吗?   java为什么自定义系统类加载器不工作?   数组在Java中解析具有多个分隔符的字符串   PMD Java 8德米特定律   JavaSpringMVC表单验证不适用于嵌套的复杂类型   让Eclipse Java组织导入以使用Google checkstyle   java Appium:无法创建新会话   java如何在数组中声明新字段   java如何解决“无法初始化类org.apache.cassandra.config.DatabaseDescriptor”?   java AsyncTask创建socket   java向@CreatedBy添加更多信息   如何在ubuntu中运行包含大量jars依赖项的java文件   java如何使用<s:select>标记并在中休眠来填充下拉列表?   java获取错误:找不到符号变量“level”和“next_level_button”   javaweb应用中基于UI的ajax显示代码流   Java长到MySql   java JvisualVM:奇怪的应用程序行为   ubuntu将Java程序的输出结果保存到一个文件中