使用beautifulsoup检查图书馆图书的可用性

<tr> <td valign="top"><a href="/cgi-bin/spydus.exe/ENQ/EXPNOS/GENENQ/1564461?LOCX=BIPL">**Bishan Public Library**</a> </td> <td valign="top"> <book-location data-title="The opposite of everyone" data-branch="BIPL" data-usagelevel="001" data-coursecode="" data-language="English" data-materialtype="BOOK" data-callnumber="JAC" data-itemcategory="" data-itemstatus="" data-lastreturndate="20160322" data-accession="B31189097E" data-defaultLoc="Adult Lending">Adult Lending</book-location> </td> <td valign="top"><a href="/cgi-bin/spydus.exe/ENQ/EXPNOS/BIBENQ/1564461?CGS=E*English">English</a> <a href="/cgi-bin/spydus.exe/WBT/EXPNOS/BIBENQ/1564461?CNO=JAC&CNO_TYPE=B">JAC</a> </td> <td valign="top">**Available** </td> </tr> <tr> <td valign="top"><a href="/cgi-bin/spydus.exe/ENQ/EXPNOS/GENENQ/1564461?LOCX=BMPL">**Bukit Merah Public Library**</a> </td> <td valign="top"> <book-location data-title="The opposite of everyone" data-branch="BMPL" data-usagelevel="001" data-coursecode="" data-language="English" data-materialtype="BOOK" data-callnumber="JAC" data-itemcategory="" data-itemstatus="" data-lastreturndate="20160405" data-accession="B31189102C" data-defaultLoc="Adult Lending">Adult Lending</book-location> </td> <td valign="top"><a href="/cgi-bin/spydus.exe/ENQ/EXPNOS/BIBENQ/1564461?CGS=E*English">English</a> <a href="/cgi-bin/spydus.exe/WBT/EXPNOS/BIBENQ/1564461?CNO=JAC&CNO_TYPE=B">JAC</a> </td> <td valign="top">**Available** </td> </tr>

>>> keyword = '<a href="/cgi-bin/spydus.exe/ENQ/EXPNOS/GENENQ/1564461?LOCX=' >>> string.partition('keyword') Traceback (most recent call last): File "<pyshell#8>", line 1, in <module> string.partition('keyword') TypeError: 'NoneType' object is not callable

1条回答

网友

1楼 · 发布于 2024-10-02 10:33:11

不，您没有将string生成Python字符串，因为您没有将str(string)的结果赋给任何变量，因此它将丢失：

>>> type(string)
<class 'bs4.BeautifulSoup'>
>>> type(str(string))
<type 'str'>
>>> type(string)
<class 'bs4.BeautifulSoup'>

变量string不变。试试这个：

>>> string = str(string)
>>> type(string)
<type 'str'>

现在您有了一个str字符串。你知道吗

另一方面，为什么不使用BeautifulSoup从HTML中提取数据呢？这就是它的目的，也是它擅长的。这里有一种方法：

import requests
from bs4 import BeautifulSoup

html = requests.get('http://catalogue.nlb.gov.sg/cgi-bin/spydus.exe/FULL/EXPNOS/BIBENQ/1592917/156302298,2').text
soup = BeautifulSoup(html)

holdings = soup.find('table', class_='clsTab1').find_all('tr')
for holding in holdings:
    cells = holding.find_all('td')
    if cells:
        library = cells[0].text
        availability = cells[-1].text
        print('{}: {}'.format(library, availability))

输出

Ang Mo Kio Public Library: Available
Bedok Public Library: Available
Bishan Public Library: Available
Bukit Merah Public Library: Available
Central Public Library: Available
Geylang East Public Library: Available
Jurong Regional Library: Available
Jurong West Public Library: Available
library@orchard: Available
Marine Parade Public Library: Onloan - Due: 13 May 2016
Queenstown Public Library: Onloan - Due: 29 May 2016
Tampines Regional Library: Available
Toa Payoh Public Library: Available
Woodlands Regional Library: Available

相关问题更多 >

编程相关推荐

热门问题

热门文章