pythonfeedparser读取后从feed中移除<script>标记和所有内容

2024-10-04 09:18:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在用feedparser阅读feed,feed中的一些内容包含

&lt;p&gt; some word &lt;/p&gt;

&lt;script&gt;
    (function(i,s,o,g,r,a,m){i["GoogleAnalyticsObject"]=r;i[r]=i[r]||function(){
      (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
      m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
      })(window,document,"script","//www.google-analytics.com/analytics.js","ga");

      ga("create", "UA-wewewefwef-13", "www.wewefwef.com");
      ga("require", "displayfeatures");
      ga("set", "anonymizeip", true);
      ga("send", "pageview");
&lt;/script&gt;

它正在删除&lt;script&gt;中的所有内容,并且只读取&lt;p&gt;。为什么会这样?我做错什么了?你知道吗

好的,我发现in the docsfeedparser会自动清理脚本标记。但是如果我知道源代码,我想要那些脚本标签呢?我如何解决这个问题?你知道吗


Tags: ltgt脚本com内容wwwfeedscript