Python中文
首页
教程
问答
标签
搜索
登录
注册
用Python规范化空白
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在使用<a href="https://scrapy.org/" rel="nofollow noreferrer">scrapy</a>构建一个数据提取,并希望规范化从HTML文档中提取的原始字符串。下面是一个字符串示例:</p> <pre><code> Sapphire RX460 OC 2/4GB </code></pre> <p>注意两组由两个空格组成的空白,它们位于字符串文字前面,介于<code>OC</code>和<code>2</code>之间。在</p> <p>Python提供了<a href="https://stackoverflow.com/questions/1185524/how-do-i-trim-whitespace-with-python">How do I trim whitespace with Python?</a>中描述的trim,但是它不能处理<code>OC</code>和{<cd2>}之间的两个空格,我需要将它们折叠成一个单独的空间。在</p> <p>我尝试在使用<a href="https://doc.scrapy.org/en/latest/topics/selectors.html" rel="nofollow noreferrer">scrapy Selector</a>提取数据时使用XPath中的<a href="http://devdocs.io/xslt_xpath/xpath/functions/normalize-space" rel="nofollow noreferrer">^{<cd5>}</a>,这是可行的,但赋值冗长且向右偏移很强:</p> ^{pr2}$ <p>有没有一种使用Python规范化空白的优雅方法?如果不是一行行,有没有一种方法可以把上面的行分解成更容易阅读的内容而不产生缩进错误,例如</p> <pre><code>product_title = product.css('h3') .xpath('normalize-space((text()))') .extract_first() </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以使用:</p> <pre><code>" ".join(s.split()) </code></pre> <p>其中<code>s</code>是您的字符串。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在python中从数据帧列中删除分类值?
8 回答
如何在python中从数据帧列表中删除引号
3 回答
如何在python中从数据帧创建列表
8 回答
如何在Python中从数据帧创建嵌套的JSON
5 回答
如何在Python中从数据帧显示wordcloud
5 回答
如何在Python中从数据帧的时间戳中删除字符
2 回答
如何在Python中从数据帧绘制简单绘图?
2 回答
如何在python中从数据帧行提取具有特定长度的范围?
10 回答
如何在python中从数据帧设置dict中的值
6 回答
如何在Python中从数据库中获得一个结果
1 回答
如何在python中从数据框中绘制分类条形图
8 回答
如何在Python中从数据框中选择特定细节?
5 回答
如何在python中从数据集中删除unicode
9 回答
如何在python中从数据集中删除某些数值?
5 回答
如何在python中从数据集中选择行
3 回答
如何在Python中从数组中删除元素
6 回答
如何在python中从数组中删除单个倒逗号?
6 回答
如何在python中从数组中删除对象?
3 回答
如何在python中从数组中删除引号
2 回答
如何在python中从数组中删除所有最小值
8 回答