Python中文
首页
教程
问答
标签
搜索
登录
注册
无法在BeautifulSoup中获取一些细节
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在使用BeautifulSoup来scrpe数据,所有的东西都在我的代码中工作,除了一件事,那就是价格。我试图刮一个房地产网站,但无法刮的价格.网站是“<a href="https://www.proptiger.com/all-projects" rel="nofollow noreferrer">https://www.proptiger.com/all-projects</a>”</p> <p>以下是我的代码:</p> <pre><code>from urllib.request import urlopen from bs4 import BeautifulSoup import requests import time import json import io url = "https://www.proptiger.com/all-projects" # for all pages https://www.proptiger.com/all-projects?page=2 html = urlopen(url) soup = BeautifulSoup(html, "html.parser") container = soup.find_all("section", {"class":"project-card-main-wrapper"}) print(len(container)) newFile = "Prop_Data.csv" f = open(newFile, "w", encoding = "utf-8") Headers = "Project, Url, City, Builder, Price\n" f.write(Headers) #f.close() for i in container: contain = i.find_all("div", {"class":"proj-name"}) project_name = contain[0]['title'] url2 = i.div['data-url'] url1 = "https://www.proptiger.com" url = url1+url2 get_city = i.find_all("span", {"itemprop":"address"})#or by div, {"class":"loc"} city = get_city[0]["title"]# or by getcity.text builder = i.find_all("div", {"class":"projectBuilder put-ellipsis"}) bName = builder[0].text price = i.find_all("div", {"class":"project-price"}) pricereal = price[0].text#not able to print the print says list out of index print(pricereal) #f.write("{}".format(project_name) +",{}".format(url)+",{}".format(city)+",{}".format(bName)+"\n") #f.close() </code></pre> <p>现在,每当我运行这个代码时,它都会显示列表超出范围。你知道吗</p> <p>以下是价格:</p> <p/><div class="snippet" data-lang="js" data-hide="false" data-console="true" data-babel="false"> <div^{cl2}$ <pre class="snippet-code-js lang-js prettyprint-override"><code><div class="project-price" itemscope="" itemtype="https://schema.org/PriceSpecification"><span itemprop="minPrice">₹ 32.4 L</span><span itemprop="maxPrice">- ₹ 88.0 L</span> <!-- -if(project.avgPricePerUnitArea)div.text-right.price-perunit &#8377; / sq ft--> </div></code></pre> </div> </div> <p>我想要最低价格和最高价格,所以我做文本,得到56=-6个项目的价格,然后列出超出范围。有人知道我做错了什么吗?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>当你刮取不可用的信息时,你会得到那个错误。如果您正在查找价格,但没有显示特定项目的值,则会显示错误并中断代码。它被破坏是因为你的代码说那里有东西,而实际上没有</p> <p>解决这个问题的方法是使用try-except语句。你知道吗</p> <pre><code>try: pricereal = price[0].tex except: pricereal = "n/a" </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
文本导入时标题行中的特殊字符
3 回答
文本小部件:在没有输入时更新并在循环后保持空闲
2 回答
文本小部件tkin
3 回答
文本小部件tkinter中的标签更改或文本外观更改是否有撤消功能?
5 回答
文本小部件tkinter复制图像选项
4 回答
文本小部件上的Python Tkinter ttk滚动条未缩放
8 回答
文本小部件上的滚动条可能需要根据制表符ord显示前进行滚动
6 回答
文本小部件不显示lis中的内容
3 回答
文本小部件不显示Unicode字符
9 回答
文本小部件中写入的行间距
1 回答
文本小部件中的文本作为变量
5 回答
文本小部件中的滚动条仅显示在底部
6 回答
文本小部件中的选项卡键空间计数
1 回答
文本小部件作为Lis
4 回答
文本小部件在主框架中扩展列宽
9 回答
文本小部件未使用删除功能清除
4 回答
文本小部件滚动动画(Tkinter、Python)
1 回答
文本居中。格式正确吗?
3 回答
文本差分算法
6 回答
文本已知时音频文件中的单词索引
2 回答