如何在Pandas中使用quotechar读取和写入DAT文件中的thorn字符?

2024-05-19 11:03:03 发布

您现在位置:Python中文网/ 问答频道 /正文

请看下面我的代码。代码按预期工作,但输出DAT文件缺少þ (拉丁文小写字母(THORN)字符

import pandas as pd

inputdat = "C:/Downloads/Python/SAMPLEDATA.dat"
outputdat = "C:/Downloads/Python/Output.dat"

colnames = ["ID", "Company", "Employee", "Salary", 'Years']
df = pd.read_csv(inputdat, names = colnames, header = None, skiprows = 1, encoding='UTF-8', quotechar='\xfe', sep='\x14', engine='python')
filter = ['UID_001', 'UID_002']

df.loc[df.ID.isin(filter), ['Salary', 'Years']] = ""

df.to_csv(outputdat, quotechar='\xfe', sep='\x14', index=False, encoding='UTF-8')

如何确保输出数据中包含thorn符号

示例输入:https://imgur.com/vUWCRfF

电流输出:https://imgur.com/sUlsy87

所需输出:https://imgur.com/UnX0j43

注:我很抱歉在图片形式张贴的样本输入和输出。否则分隔符和引号字符显示不正确


Tags: 代码httpscomiddfdownloads字符dat
1条回答
网友
1楼 · 发布于 2024-05-19 11:03:03

看起来您面临的问题是没有添加引号(thorn字符),因为默认的引号规则是csv.QUOTE_MINIMAL。看起来你想要csv.QUOTE_ALL

import csv

df.to_csv(outputdat, quotechar='\xfe', sep='\x14', quoting=csv.QUOTE_ALL,
          index=False, encoding='UTF-8')

相关问题 更多 >

    热门问题