Python正则表达式从字符串中提取数字

2024-09-27 07:20:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用python从一个大的html文件中提取一个数字。 我的想法是这样使用regex:

import re
text = 'gfgfdAAA1234ZZZuijjk'
try:
    found = re.search('AAA(.+?)ZZZ', text).group(1)
except AttributeError:
    found = ''

found

但不幸的是,我不习惯regex,我无法调整此示例来从中提取0,54125

^{pr2}$

有没有其他方法来提取这个数字,或者有人能帮我处理正则表达式吗?在


Tags: 文件textimportresearchhtmlgroup数字
2条回答

如果要输出0,54125(或\d+,\d+),则需要为输出设置一些条件。在

根据以下输入

 (...)<div class="vk_ans vk_bk">0,54125 count id</div>(...)

如果要提取0,54125,似乎可以尝试以下几种regex

^{pr2}$

Demo

或者

(?<=\<div class=\"vk_ans vk_bk\"\>)\d+,\d+

Demo

等等。。在

在搜索文本之前,可以替换文本中的某些字符。{cd1>你可以这样做:

text = 'gfgfdAAA12,34ZZZuijjk'
try:
    text = text.replace(',', '')
    found = re.search('AAA(\d+)ZZZ', text).group(1)
except AttributeError:
    found = ''

print found
# 1234

如果您需要捕获一行中的数字,可以使您的模式更通用,如下所示:

^{pr2}$

相关问题 更多 >

    热门问题