使用正则表达式从URL中删除空格

2024-10-01 02:27:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这样一段:

《东方日报》是一份学生经营的报纸,为伊利诺伊州查尔斯顿市的东伊利诺伊大学社区出版。这家报纸创建于1915年。www.丹尼斯。com/media/storage/paper309/news/2005/11/04/news/TheNews。转弯90-1045667。shtml在学年的工作日出版,夏季每周出版两次。在

该报曾获得多个州和国家级奖项,包括多个起搏器奖。http://search。阿托姆兹。搜索/com/?sp_a=sp01089f00&sp_f=iso-8859-1&sp_q=%22每日+东方+新闻%22该报的编辑、制作和广告人员完全由一系列学位课程的学生组成。在

我想删除上面段落中的粗体部分的空格。在

预期输出:

《东方日报》是一份学生经营的报纸,为伊利诺伊州查尔斯顿市的东伊利诺伊大学社区出版。该报成立于1915年,在学年的工作日出版,夏季每周出版两次。在

该报曾获得多个州和国家级奖项,包括多个起搏器奖。http://search。阿托姆兹。com/搜索/?sp_a=sp01089f00&sp_f=iso-8859-1&sp_q=%22每日+东方+新闻%22该报的编辑、制作和广告人员完全由一系列学位课程的学生组成。在

已尝试regexp-(http://(?:.)*?\.) ((?:.)*?\.) ((?:.)*?\.) ((?:.)*?\.) ((?:.)*?\.)

但它对第一个URL有效而不是对第二个URL起作用。因为我用这个((?:.)*?\.)来检查(点)的重复组和空格。它似乎不适用于第二个URL。有没有办法对所有的网址做这样的事情。在

检查这个-https://regex101.com/r/tB9oL5/7


Tags: comhttpurlsearchiso新闻社区学生
2条回答

可能是这样吗?

list = str.split('http://search. atomz. com/search/?sp_a=sp01089f00&sp_f=iso-8859-1&sp_q=%22daily+eastern+news%22')
nlist = ''.join(list)
print nlist

返回;http://search.atomz.com/search/?sp_a=sp01089f00&sp_f=iso-8859-1&sp_q=%22daily+eastern+news%22

您可能需要用变量等使其复杂化,因为这是一个基本函数。。在

不幸的是,这是不可能的,除非你做了一些假设,比如要求网址出现在句子的末尾,以.html结尾等等(这是不合理的,特别是因为你的例子中的所有链接都不会出现在句子的末尾,也不会以共同的后缀结尾)。为了说明这不可能的原因,请观察您如何区分:

A new site: http://example.com/ appeared.

以及:

A new site: http://example.com/ appeared.

相关问题 更多 >