如何使用Python从MySql表中循环解析模式问题的回答

如何使用Python从MySql表中循环解析模式

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我试图用regex解析scrapy结果，问题是我的regex模式位于MySQL表中。。我很难按顺序循环模式，以便返回没有任何html标记的干净内容。。简单地说，html结果scrapy-&gt；parse with pattern in row1（例如：clean html above content），parse with pattern in row2（clean html below content）。。。。。-&gt；清洁 示例 <pre><code><body> <title> <some tags> <content> <footer tags> <another tags> </body> </code></pre> 我正试图用这个表、字段名（pattern、sequence、replacer）、值来清除html： <pre><code>row1 <body.*?some tags> 1 None row2 <footer.*?/body> 2 None row3 3 Enter row4 #&quot 4 "" </code></pre> 因此，我得到了一个干净的内容作为回报，我使用regex替换模式，而不是xpath匹配，因为我希望用自己的html标签来废弃很多web 这是我的代码，它没有引发错误，但结果是重复的。。它应该是一个干净的结果从一个刮擦的结果。我想我做错了什么，但因为我是python和scrapy的新手，所以想不通 <pre><code> def parse(self, response): for mbuh in response.xpath('//body'): Item = ParsingerbotItem() Item['ling'] = str(response.url) ngaliase = re.findall("\w+.com", str(response.url))[0] mmhtml = mbuh.xpath('//body').extract() cur.execute("select aliase, pattern, seq, opsi, replacer from tb_bersihin where aliase='"+ngaliase+"\' order by seq asc") for filde in cur.fetchall(): faliase = filde[0] fpattern = filde[1] fseq = filde[2] fopsi = filde[3] freplacer = filde[4] print "faliase=%s,fpattern=%s,furutan=%d,fopsi=%s,freplacer=%s" % \ (faliase, fpattern, fseq, fopsi, freplacer ) if ( freplacer == "NO" ) : freplacer="" if ( fopsi == "NL" ) : fopsi="re.DOTALL" k1 = re.sub(fpattern , freplacer, str(mmhtml), re.DOTALL) print k1 </code></pre> 先谢谢你

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何使用Python从MySql表中循环解析模式

1 个回答

相关Python问题