从字符串中提取数字

nums-from-string的Python项目详细描述


字符串中的数字

这个python模块提供了获取输入字符串中的数字或数字字符串标记的函数。

捕获文本中的数字是从文档中检索数字信息的常见预处理。然而,由于这些数字的各种表示形式,使用简单的规则捕获它们有些困难。我们在这个库中打包了几个覆盖范围广泛的regex规则,希望它能成为nlp研究人员的有用工具。

安装

pip install nums_from_string

用法

  1. 从字符串中提取数字
>>>string1="U.S. goods and services trade with China totaled an estimated $710.4 billion in 2017. ">>>nums_from_string.get_nums(string1)[710.4,2017]>>>string2="David spent .25 billion dollars buying a building and 600,000.5 dollars getting himself a car.">>>nums_from_string.get_nums(string2)[0.25,600000.5]
  1. 从字符串中提取数字字符串
>>>string1="U.S. goods and services trade with China totaled an estimated $710.4 billion in 2017. ">>>nums_from_string.get_numeric_string_tokens(string1)['710.4','2017']>>>string2="David spent .25 billion dollars buying a building and 600,000.5 dollars getting himself a car.">>>nums_from_string.get_numeric_string_tokens(string2)['.25','600,000.5']>>>string3="Find the product of 4 and -5?">>>nums_from_string.get_numeric_string_tokens(string3)['4','-5']>>>string4="The flight number is Airbus A330-300">>>nums_from_string.get_numeric_string_tokens(string4,no_minus=True)['330','300']
  1. 将字符串转换为数字
>>>s0="255">>>nums_from_string.to_num(s0)255>>>s1="-255,000.0">>>nums_from_string.to_num(s1)-255000.0>>>s2="87/25">>>nums_from_string.to_num(s2)Fraction(87,25)>>>s3="a1b2">>>nums_from_string.to_num(s3)Traceback(mostrecentcalllast):...ValueError:Invalidnumericalstring!

待办事项

  • []捕获字符串中分数的模式
  • []捕捉这样的模式“-3.5/11”

参考

许可证

这个项目是根据麻省理工学院的许可条款授权的。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
用cucumberjvm执行java异步步骤   java通过Jackson2导出/导入JSON文件。9.7   java Tomcat在页面加载时给出500错误   将filereader合并到代码中的java问题   从GUI java将对象属性写入文件时发生swing错误   java简单程序,用于检查输入字符串是否为关键字(指定了关键字)   java如何在布局之间滑动时打开音频文件?   hibernate解析Java。lang.ClassCastException   java如何解决记录测试结果的Jenkins构建错误?   Java:在重写文件之前检查文件是否需要更新的最佳方法是什么?   mongodb在Java中重用数据库连接   java Hibernate(n+1)使用非k连接选择   java如何在Spring批处理中创建JSON文件读取器   java将MuPDF导入Android应用程序   字典我对Java中的多态性有疑问