写入特殊字符到csv文件时发生的问题

from bs4 import BeautifulSoup from datetime import date import requests import csv source = requests.get('https://aws.amazon.com/blogs/aws/').text soup = BeautifulSoup(source, 'lxml') # csv_file = open('aitrendsresults.csv', 'w') csv_file = open('aws_cloud_results.csv', 'w' , encoding = 'utf8' ) csv_writer = csv.writer(csv_file) csv_writer.writerow(['title','img','src','summary']) match = soup.find_all('div',class_='lb-row lb-snap') for n in match: imgsrc= n.div.img.get('src') titlesrc= n.find('div',{'class':'lb-col lb-mid-18 lb-tiny-24'}) titletxt= titlesrc.h2.text anchortxt= titlesrc.a.get('href') sumtxt= titlesrc.section.p.text print(sumtxt) csv_writer.writerow([titletxt,imgsrc,anchortxt,sumtxt]) csv_file.close()

3条回答

网友

1楼 · 编辑于 2024-10-02 00:41:27

创建一个函数来处理ASCII字符（即连字符、分号），并将字符串作为参数传递到下面的函数中：

def decode_ascii(string):
    return string.encode('ascii', 'ignore').decode('ascii')

input_text = 'Amazon Forecast - Now Generally Available'
output_text = decode_ascii(input_text)
print(output_text)

输出应该是CSV中的Amazon Forecast - Now Generally Available

网友

2楼 · 编辑于 2024-10-02 00:41:27

我也和BS合作过，我想你只是犯了个小错误。在第8行打开csv文件的地方，编码应该是“UTF-8”而不是“utf8”。看看能不能帮上忙

网友

3楼 · 编辑于 2024-10-02 00:41:27

使用标题作为测试以下作品为我

from bs4 import BeautifulSoup
import requests, csv

source = requests.get('https://aws.amazon.com/blogs/aws/').text
soup = BeautifulSoup(source, 'lxml')

with open("aws_cloud_results.csv", "w", encoding="utf-8-sig", newline='') as csv_file:
    w = csv.writer(csv_file, delimiter = ";", quoting=csv.QUOTE_MINIMAL)
    w.writerow(['title'])
    match = soup.find_all('div',class_='lb-row lb-snap')
    for n in match:
        titlesrc= n.find('div',{'class':'lb-col lb-mid-18 lb-tiny-24'})
        titletxt= titlesrc.h2.text
        w.writerow([titletxt])

相关问题更多 >

编程相关推荐

热门问题

热门文章