我正在遍历一个.csv的合同,试图从网站中提取一个列
我想从网页末尾的表中抓取标有“商品描述”的列。但是,我不知道如何获取列—只获取行
这是我目前正在使用的代码
def scraper(first, second, third):
url = "https://www.austintexas.gov/financeonline/contract_catalog/OCCViewMA.cfm?cd=%s&dd=%d&id=%s" % (first, second, third)
soup = BeautifulSoup(urllib2.urlopen(url).read())
foundtext = soup.find('td',text="Commodity Description")
table = foundtext.findPrevious('table')
rows = table.findAll('tr')
second_column = []
for row in rows:
print row.contents
我希望最终的输出返回是该列中所有行的文本,行之间有返回框
有什么想法吗
对于找到的每一行,查找所有
td
元素并按索引获取所需的元素:印刷品:
相关问题 更多 >
编程相关推荐