Regex通过改变Midd从HTML获取值问题的回答

Regex通过改变Midd从HTML获取值

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我试图在twitter链接的末尾正则表达式，其中唯一的标识符是类值fl。因此，正则表达式（据我所知）必须包括： <pre><code>class=\"fl\" </code></pre> 考虑更改中间部分，其中\S+不起作用，然后查找并分组： <pre><code> data-href="http://www.twitter.com/(newyorklife) </code></pre> 在括号中可以找到组。我试图解析的整个字符串是。你知道吗 <pre><code><g-link class="fl"><a href="/url?sa=t&amp;rct=j&amp;q=&amp;esrc=s&amp;source=web&amp;cd=32&amp;cad=rja&amp;uact=8&amp;ved=0ahUKEwjknIy87oHWAhXHi1QKHXQdAJsQ9zAIyQEwHw&amp;url=http%3A%2F%2Fwww.twitter.com%2Fnewyorklife&amp;usg=AFQjCNHKcAcw6H6cYG3YH1j4V3UOxX1whw" onmousedown="return rwt(this,'','','','32','AFQjCNHKcAcw6H6cYG3YH1j4V3UOxX1whw','','0ahUKEwjknIy87oHWAhXHi1QKHXQdAJsQ9zAIyQEwHw','','',event)" data-href="http://www.twitter.com/newyorklife"><div jsl="$t t-XNwoAoU5dyo;$x 0;" class="r-iBA3fWkVHWLE"><g-img class="_tek"><img id="uid_4" src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAACAAAAAgCAIAAAD8GO2jAAABZUlEQVR4AWLQWfWQpmjUAjxo1IJRC2wBpJTDQkVRFIafKBujZrnGjbNd84wHiJNs27btrm3rrFbW1T73m20u/yMsW0cBg6zue5XCYLFQcC41JK0I3PsYaWvC+BkugYFljrbmWPp/H/86FOnhB2hGZbTg/dBhFoEBhsoEAO23Su9+5s/9nA0R/ANtXEgNJTtiAgObfB28gZaKt8Wen2ZarhRgjVL8nagGmetC+IFMb5lgqOtOZAtsLVgjcIhFZqD+RLYj0IFzGCwUcRctc7XgNNcyA7GBhAW+EWvnHK3XCjqDhg3OUpvAEegFTgAdA+nrwnuF4zCw7DSlwqOPscRxUAmtiYqY5NDXImz/6mPprlAP1sDgcjdFLokdCkPGW6Kstmbhtoim2IWNsRsvFXNsjURvBmvgiMROc11S0+BhVvmhFAUDhewrISgbg4/qlyUdeEnl+sBk7SOgfcBSb3jWaKMWjFoAABKespvtvzYlAAAAAElFTkSuQmCC" data-deferred="1" class="_WCg" height="32" width="32" alt="" onload="typeof google==='object'&amp;&amp;google.aft&amp;&amp;google.aft(this)"></g-img></div>Twitter</a></g-link> </code></pre> 我不知道正则表达式是否有一个方法，或者是否可以跳过整个中间部分，其中包含这么多特殊字符。我一直在玩pythex.org网站一段时间，找不到一个简单地找到初始值然后跳过所有内容的方法，直到。。。指定值。有什么想法吗？你知道吗 编辑。我想要字符串'Newyorklife'作为输出。虽然这是一个不断变化的值，但实际上我只想要后面的\w+推特网站/. 问题是class=fl是网页上行的唯一唯一标识符（twitter和data href在页面的其他地方显示）。你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

Regex通过改变Midd从HTML获取值

1 个回答

相关Python问题