TypeError:应为字符串或带有BeautifulGroup的缓冲区

from bs4 import BeautifulSoup import requests import re url = 'https://www.tokopedia.com/tokoonline22/sendok-ukur-elektrik-500g-maks-white?' page3 = requests.get(url) soup3 = BeautifulSoup(page3.text, "lxml") #No problem. #v = """*OMCB07BK* Tas backpack ini didesign khusus untuk menaruh drone DJI Phantom 3 beserta dengan aksesoris-aksesorisnya seperti propeller, baterai dan remot kontrol. Setiap slot tas didesign untuk menaruh semua part dari drone DJI sehingga drone mudah dirakit saat ingin digunakan. Features Shoulder Bag Tas ini mirip seperti tas ransel hanya berbeda pada komparmen penyimpanan dimana setiap komparmen didesign untuk menaruh part-part dari DJI Phantom 3. Easy to Access Anda dapat merekit dan menggunakan drone dengan sangat cepat dan mudah berkat designnya yang terbuka. Designed for DJI Phantom 3 Didesign khusus untuk menaruh drone DJI Phantom 3 selain drone juga dapat menaruh aksesoris-aksesoris nya. Specifications Dimension 37 x 26 x 7 cm #""" v = soup3.find("p", {"itemprop": "description"}) result = re.sub('', "", v) print(result)

2条回答

网友

1楼 · 编辑于 2024-10-01 11:19:23

另一方面，实际上并不需要正则表达式。您可以使用BeautifulSoup本身来unwrap（我认为这是您要实现的）元素：

for elm in soup3.find_all("p", {"itemprop": "description"}):
    elm.unwrap()

网友

2楼 · 编辑于 2024-10-01 11:19:23

re.sub需要string变量，您的v变量是bs4 element tag。可以将bs4元素更改为字符串：

newv = str(v)
result = re.sub('<p class="mt-20" itemprop="description">', "", newv)

相关问题更多 >

编程相关推荐

热门问题

热门文章