如何在Beauty Soup中获取get_文本的位置

2024-10-01 13:27:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试将get_text的结果存储在变量中

我正在过滤我的html以便找到我需要的信息。例如,如果我想提取多个根目录,则可以显示多个根目录,这就是我获取的信息的显示方式:

<span cetxt\"="" class='\"rSpnValor' vidc0='\"74922\"'>74922</span>
<span cetxt\"="" class='\"rSpnValor' vidc0='\"75005\"'>75005</span>

使用get_text时,它将如下所示:

74922
75005

我分享了我的一些代码:

def getValBySpanName(name):
    dataArray = soup.find_all('div', {'class': '\\\"rDivDatosAseg'})
    for data in dataArray:
        data_container = data
        spans_data = data_container.find_all("span")
        info = []
        if spans_data[0].get_text() == name:
           container_values = spans_data[1].get_text()
           return container_values
       
file_number= getValBySpanName('Número de radicado')
print(file_number)

问题是我得到了第一个位置“74922”。我需要找到一种方法将每个值存储在变量中(然后我将在sql中插入这些数据),因此我需要逐个保存它

我试着用for遍历它们,但它遍历了第一个值的位置,类似于'7,4,9,2,2'


Tags: textname信息datagetcontainerclass根目录