Python中文
首页
教程
问答
标签
搜索
登录
注册
写入特殊字符到csv文件时发生的问题
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在将网页的爬网输出写入CSV文件。但是,很少有特殊字符(如“hyphen”)无法正确解析</p> <p>原文:亚马逊预测-现已正式上市</p> <p>csv结果:亚马逊预测– 现已普遍提供</p> <p>我试过下面的代码</p> <pre><code>from bs4 import BeautifulSoup from datetime import date import requests import csv source = requests.get('https://aws.amazon.com/blogs/aws/').text soup = BeautifulSoup(source, 'lxml') # csv_file = open('aitrendsresults.csv', 'w') csv_file = open('aws_cloud_results.csv', 'w' , encoding = 'utf8' ) csv_writer = csv.writer(csv_file) csv_writer.writerow(['title','img','src','summary']) match = soup.find_all('div',class_='lb-row lb-snap') for n in match: imgsrc= n.div.img.get('src') titlesrc= n.find('div',{'class':'lb-col lb-mid-18 lb-tiny-24'}) titletxt= titlesrc.h2.text anchortxt= titlesrc.a.get('href') sumtxt= titlesrc.section.p.text print(sumtxt) csv_writer.writerow([titletxt,imgsrc,anchortxt,sumtxt]) csv_file.close() </code></pre> <p>你能帮我得到像上面提供的原文一样的文本吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我也和BS合作过,我想你只是犯了个小错误。在第8行打开csv文件的地方,编码应该是“UTF-8”而不是“utf8”。 看看能不能帮上忙</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
当用户用PYTHON设置一个或一个不带值的URL时,他们怎么能输入一个/a的代码呢?
8 回答
当用户登录到站点时,如何显示不同的导航栏
10 回答
当用户登录时,在Flask中向用户显示处理结果
1 回答
当用户的Flask会话结束时,我如何从Redis后端中移除所有Celery结果?
3 回答
当用户的Okta配置文件字段当前为blan时,更新该字段
9 回答
当用户的付款逾期2天时,从Django模型检索数据
4 回答
当用户的消息以问号结尾时,如何让机器人说些什么?
5 回答
当用户的系统上可能也安装了Python 2.7时,如何在用户的系统上运行Python 3脚本?
6 回答
当用户确定打印数量时,使用Matplotlib打印动画
5 回答
当用户离开时是否可以删除整个网页?
8 回答
当用户给出一个单词时如何打印?
10 回答
当用户继续更改TKin中的值(使用trace方法)时,使用Entry并更新输入的条目
2 回答
当用户编辑表单字段时,从Django时间字段中删除秒数
8 回答
当用户被更改时,消息不会来自web套接字
5 回答
当用户访问表单时,如何使表单为只读,而不具有更改权限
8 回答
当用户试图更改对象的值时,使用描述符类引发RuntimeError
2 回答
当用户调整GUI的大小时,是否有方法更改GUI内容的大小?
2 回答
当用户调整风的大小时,pythontkinter小部件的大小会不均匀
8 回答
当用户购买某个类别时,是否查找其他类别的销售?
2 回答
当用户转到上一页时,Django和芹菜插入操作
7 回答