2024-10-02 20:34:10 发布
网友
我试着用这个:
c=requests.get('https://www.uniberg.com/referenzen.html').text c.count('Programmierung')
但是输出显示有2次出现,而实际上没有。在
我也试过了:
但是它还返回我不想要的单词的计数,比如Mitarbeiterphilosophie。 有人能找到一个改进的方法或建议另一个方法吗?在
Mitarbeiterphilosophie
在请求.get(URL)返回整个Web页面(在googlechrome上使用ctrl+U查看,或者使用wget下载网页),而不仅仅是Web呈现的内容浏览器。那个所以count显示为2。在
今天https://www.uniberg.com/referenzen.html连续发生2次Programmierung
https://www.uniberg.com/referenzen.html
Programmierung
我认为,你需要签入HTML源代码,而不是在使用浏览器的呈现中。在
单词Programmierung在HTML部分中有这个CSS
CSS
section .detail { display: none; }
关于第二点:
试试这个(使用regex):
regex
使用正则表达式:
\w
\W
[^\w]
在请求.get(URL)返回整个Web页面(在googlechrome上使用ctrl+U查看,或者使用wget下载网页),而不仅仅是Web呈现的内容浏览器。那个所以count显示为2。在
今天
https://www.uniberg.com/referenzen.html
连续发生2次Programmierung
我认为,你需要签入HTML源代码,而不是在使用浏览器的呈现中。在
单词
Programmierung
在HTML部分中有这个CSS
关于第二点:
试试这个(使用
^{pr2}$regex
):使用正则表达式:
\w
代表“单词字符”,通常为[A-Za-z0-9]。在\W
是[^\w]
的缩写,\w
的否定版本。在相关问题 更多 >
编程相关推荐