Python中文
首页
教程
问答
标签
搜索
登录
注册
了解web刮取的无效文字错误
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正试图从维基百科上搜集1992年至2014年的广告牌百强,然后清理数据。我在结尾处得到一个“无效文字”错误:</p> <pre><code>years = range(1992,2015) yearstext = dict() for year in years: t_1992=requests.get('http://en.wikipedia.org/wiki/Billboard_Year-End_Hot_100_singles_of_%(year)s' % {"year":year}) soup = BeautifulSoup(t_1992.text, "html.parser") yearstext[year]=soup def parse_year(year, ytextdixt): rows = soup.find("table", attrs={"class": "wikitable"}).find_all("tr")[1:] cleaner = lambda r: [r[0].get_text(), int(r[1].get_text()), r[2].get_text(), r[2].find("a").get("href"), r[3].get_text(),r[3].find("a").get("href")] fields = ["band_singer", "ranking", "song", "songurl","titletext","url"] songs = [dict(zip(fields, cleaner(row.find_all("td")))) for row in rows] ValueError: invalid literal for int() with base 10: 'Pharrell Williams' </code></pre> <p>有人知道这是为什么吗?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>'r[1].get\u text()'在某些情况下返回'Pharrell Williams'</p> <p>然后“int(r[1].get\u text())”触发了此异常。你知道吗</p> <p>所以重新检查你从网址上得到的细节。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在乒乓球比赛中预测球的轨迹,对于AI球拍预测?
4 回答
如何在乒乓球游戏中阻止球
6 回答
如何在乘法和模中不乘空间?
8 回答
如何在乘法和除以2个不同的数字之间进行交换?
5 回答
如何在也是数据一部分的单个字符上拆分大字符串
6 回答
如何在乾草堆中找到針,有更好的解決方案嗎?
6 回答
如何在事件wxWidgets中传递自定义数据
8 回答
如何在事件中使用lambda i=i?
6 回答
如何在事件中心只接收最近的数据
1 回答
如何在事件发生之前保持云函数运行?
5 回答
如何在事件发生后使页面重定向到同一页面
1 回答
如何在事件回调之间保持python生成器的状态
1 回答
如何在事件处理程序(pythonsocket、sphinx)中保留docstring
9 回答
如何在事件处理程序中更改wxRichTextCtrl的光标位置?
9 回答
如何在事件处理程序中访问外部对象?
4 回答
如何在事件循环中将协程打包为正常函数?
8 回答
如何在事件循环之外运行协同程序?
9 回答
如何在事件循环结束时为并发未来的所有线程调用类方法?
6 回答
如何在事件文件中只保留一份摘要?
7 回答
如何在事件模板中添加事件
9 回答