Python中文
首页
教程
问答
标签
搜索
登录
注册
从网站上抓取电话号码时遇到问题
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>所以我一直在尝试从一个房产交易网站(出租/购买房屋、公寓等)中提取每一个电话号码</p> <p>其中有很多类别(城市、房产类型)和广告。每当你输入广告时,底部显然会有更多的图片、描述和电话号码</p> <p>这就是有问题的网站。 <a href="https://www.nekretnine.rs/" rel="nofollow noreferrer">https://www.nekretnine.rs/</a></p> <p>我写了一个python脚本,应该可以提取这些电话号码,但它什么也没给我。这是剧本</p> <p>我认为它不起作用,因为它从主页上寻找信息,而信息不在那里,但我就是不知道如何在我的循环中包含所有这些类别的所有广告。甚至不要问API,他们没有。我的意思是,我用原版的不眠之夜脚本破坏了他们的网站</p> <pre><code>for i in range (1,50): url = ("https://www.nekretnine.rs/"+ str(i)) page = urlopen(url) soup = BeautifulSoup(page) x = soup.find_all("div", {"class":"label-small"}) time.sleep (2) for item in x: number =item.find_all("form",attrs = {"span":"cell-number"})[0].text data.append((number )) print (data) </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>对于在这里绊倒的人,我找到了答案</p> <p><a href="https://webscraper.io/" rel="nofollow noreferrer">https://webscraper.io/</a></p> <p>这个浏览器脚本包含了我所需要的一切,它很简单,不需要编码,如果需要的话还可以减去一些正则表达式</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
7 回答
为什么在使用strptim时会出现这个datetime日期错误
5 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
7 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
3 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
5 回答
为什么在使用tabla时会得到一个空的数据帧?
8 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
7 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
10 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
4 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
5 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
9 回答
为什么在使用TextBlob时会出现HTTP错误?
2 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
8 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
3 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
4 回答
为什么在使用tkinter时不能使用复选框?
9 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
10 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
2 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
2 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
5 回答