Python//BS4//标记

2024-10-05 14:31:45 发布

您现在位置:Python中文网/ 问答频道 /正文

如果有以下html:

</br></td>, <td class="first">TEXT_1a<br>TEXT_1b
                            </br></td>, <td class="first">TEXT_2a<br>TEXT_2b
                            </br></td>, <td class="first">TEXT_3a<br>TEXT_3b
                            </br></td>, <td class="first">TEXT_4a<br>TEXT_4b
                            </br></td>, <td class="first">TEXT_5a<br>TEXT_5b
                            </br></td>, <td class="first">TEXT_6a<br>TEXT_6b

我曾经

[i.text.strip() for i in soup.select('td.first')]

Hoever,然后我

   ['TEXT_1aTEXT_1b', 'TEXT_2aTEXT_2b', 'TEXT_3aTEXT_3b', 'TEXT_4aTEXT_4b', 'TEXT_5aTEXT_5b', 'TEXT_6aTEXT_6b']

如何删除文本\u 1b、文本\u 2b…文本\u nb。此外,我不想有一个数组,但N1=文本\u 1a,N2=文本\u 2a…Nn=文本\u na


Tags: textin文本brforhtmlselectclass
1条回答
网友
1楼 · 发布于 2024-10-05 14:31:45

我想你可以用:

[i.contents[0].strip() for i in soup.select('td.first')]

关于你问题的第二部分-你想在单个变量中有字段吗?你可以这么做,但这可能不是个好主意。有什么原因吗?你知道吗

或者,你知道他们有多少人,在这种情况下,你可以:

n1, n2, n3, ...nN = [i.contents[0].strip() for i in soup.select('td.first')]

或者你没有,在这种情况下数组(在python中是list)是唯一有意义的东西。你知道吗

相关问题 更多 >