Python中文
首页
教程
问答
标签
搜索
登录
注册
无法删除爬取文本之间的空格
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我用python编写了一个脚本,从一些html元素中提取一些文本。脚本现在可以解析它了。然而,问题是结果之间有一堆空格看起来很奇怪。我怎样才能修好它?任何帮助将不胜感激。在</p> <p>这是应该从中删除文本的html元素:</p> <pre><code>html=""" <div class="postal-address"> <p>11525 23 AVE</p> <p>EDMONTON, AB , T6J 4T3 </p> <p><a rel="nofollow" href="mailto:info@something.com">info@something.com</a></p> <p><a rel="nofollow" href="http://www.something.org" target="_blank">Visit our Web Site</a></p> </div> """ </code></pre> <p>这是我正在尝试的脚本:</p> ^{pr2}$ <p>结果我得到了:</p> <pre><code>11525 23 AVE, EDMONTON,\n AB\n ,\n T6J 4T3\n </code></pre> <p>预期结果:</p> <pre><code>11525 23 AVE EDMONTON, AB, T6J 4T3 </code></pre> <p>我试图在这行<code>[item.text for item in root.cssselect(".postal-address p")]</code>中应用<code>.strip()</code>和<code>.replace("\n","")</code>,但它抛出了一个显示<code>none type object</code>的错误。在</p> <p>顺便说一句,我不想有任何与<code>regex</code>相关的解决方案。提前谢谢。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>当你这样做的时候。replace(“\n”,“”)我想你必须避开斜杠。这有时会令人困惑,如果不尝试的话,我无法告诉你需要多少个斜杠来逃避它,但请尝试其中一个。。。。在</p> <pre><code>.replace("\\n","") .replace("\\\n","") .replace("\\\\n","") </code></pre> <p>使用单引号时会发生什么?在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
当用户用PYTHON设置一个或一个不带值的URL时,他们怎么能输入一个/a的代码呢?
5 回答
当用户登录到站点时,如何显示不同的导航栏
9 回答
当用户登录时,在Flask中向用户显示处理结果
10 回答
当用户的Flask会话结束时,我如何从Redis后端中移除所有Celery结果?
8 回答
当用户的Okta配置文件字段当前为blan时,更新该字段
5 回答
当用户的付款逾期2天时,从Django模型检索数据
7 回答
当用户的消息以问号结尾时,如何让机器人说些什么?
1 回答
当用户的系统上可能也安装了Python 2.7时,如何在用户的系统上运行Python 3脚本?
2 回答
当用户确定打印数量时,使用Matplotlib打印动画
4 回答
当用户离开时是否可以删除整个网页?
2 回答
当用户给出一个单词时如何打印?
6 回答
当用户继续更改TKin中的值(使用trace方法)时,使用Entry并更新输入的条目
2 回答
当用户编辑表单字段时,从Django时间字段中删除秒数
1 回答
当用户被更改时,消息不会来自web套接字
9 回答
当用户访问表单时,如何使表单为只读,而不具有更改权限
2 回答
当用户试图更改对象的值时,使用描述符类引发RuntimeError
8 回答
当用户调整GUI的大小时,是否有方法更改GUI内容的大小?
5 回答
当用户调整风的大小时,pythontkinter小部件的大小会不均匀
4 回答
当用户购买某个类别时,是否查找其他类别的销售?
7 回答
当用户转到上一页时,Django和芹菜插入操作
3 回答