在Python中保存的文件中，如何在包含特定文本的行后面打印一行？

3条回答

网友

1楼 · 编辑于 2024-09-27 07:33:49

你真正想做的是正确地解析HTML。使用beauthoulsoup库-这是很好的。在

样本代码：

import urllib2, BeautifulSoup

opener = urllib2.build_opener()
opener.addheaders[0] = ('User-agent', 'Mozilla/5.1')

response = opener.open('http://www.whitepages.com/carrier_lookup?carrier=other&number_0=1112223333&response=1').read()

bs = BeautifulSoup.BeautifulSoup(response)
print bs.findAll('div', attrs={'class': 'carrier_result'})[0].next.strip()

网友

2楼 · 编辑于 2024-09-27 07:33:49

您应该使用诸如^{}或^{}之类的HTML解析器。在

网友

3楼 · 编辑于 2024-09-27 07:33:49

你可以使用下一行

htmlsource = open('carrier.html', 'r')
for line in htmlsource:
    if '<div class="carrier_result">' in line:
         nextline = htmlsource.next()
         print nextline

一个“更好”的方法是在</div>上拆分，然后得到你想要的东西，因为有时候你想要的东西可以在一行中出现。所以如果给错了就用next（）结果.eg在

^{pr2}$

顺便说一下，如果可能的话，试着使用Python自己的web模块，比如urllib，urllib2，而不是调用externalwget。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中保存的文件中，如何在包含特定文本的行后面打印一行？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >