Python中文
首页
教程
问答
标签
搜索
登录
注册
如何使用re.findall提取文本?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<h2>我想</h2> <ul> <li>从HTML文件中提取国家名称</li> <li>我从HTML源代码中创建了一个txt文件</li> </ul> <h2>我试过的</h2> <ul> <li><a href="https://www.flightsfrom.com/WUH/destinations" rel="nofollow noreferrer">https://www.flightsfrom.com/WUH/destinations</a></li> <li>我已经写了下面的代码</li> </ul> <pre><code>import re f = open('/Users/User/Programming/plotly.csv/country_name.txt') data1 = f.read() print(re.findall('data_country\=(\".+\")', data1)) print(re.findall('a(.*)b', 'axyzb')) </code></pre> <p>txt文件如下所示: <a href="https://i.stack.imgur.com/BjAk8.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/BjAk8.png" alt="enter image description here"/></a></p> <p>但代码只给出了这个结果:</p> <p><a href="https://i.stack.imgur.com/KhnW2.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/KhnW2.png" alt="enter image description here"/></a></p> <p>我认为这就是正则表达式的问题所在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p><code>print(re.findall('data-country\=(\".+?\")', data1))</code> 这正是我需要的</p> <p><code>print(re.findall('data-country\=(\".+\")', data1))</code> 给了我太长的文字,我没有寻找</p> <p>下次我就不拍截图了。相反,我将复制和文本代码。 谢谢你让我知道</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
文本导入时标题行中的特殊字符
2 回答
文本小部件:在没有输入时更新并在循环后保持空闲
6 回答
文本小部件tkin
3 回答
文本小部件tkinter中的标签更改或文本外观更改是否有撤消功能?
5 回答
文本小部件tkinter复制图像选项
5 回答
文本小部件上的Python Tkinter ttk滚动条未缩放
10 回答
文本小部件上的滚动条可能需要根据制表符ord显示前进行滚动
5 回答
文本小部件不显示lis中的内容
9 回答
文本小部件不显示Unicode字符
4 回答
文本小部件中写入的行间距
10 回答
文本小部件中的文本作为变量
7 回答
文本小部件中的滚动条仅显示在底部
10 回答
文本小部件中的选项卡键空间计数
10 回答
文本小部件作为Lis
7 回答
文本小部件在主框架中扩展列宽
6 回答
文本小部件未使用删除功能清除
5 回答
文本小部件滚动动画(Tkinter、Python)
4 回答
文本居中。格式正确吗?
8 回答
文本差分算法
6 回答
文本已知时音频文件中的单词索引
5 回答